본문 바로가기

5. IT 이야기

삼성 SDS 화재 복구 시니라오.

제가 복구 책임자라고 가정하고 시나리오를 써보면,


건물이 절반이 타버린 상태입니다. (사진상으로 봤을때..)

화재진압한다고 물을 사용했을텐데.. 아시는것과 같이 물먹은 서버를 다시 사용할순 없습니다. 부팅이 된다한들 이게 언제 맛이 갈지 모르는데 재사용은 어림택도 없을거 같고, 연기와 물로 뒤범벅 되었을 서버실을 생각해 보면..

하.... 답 안나오네요.. 멀쩡한 서버라도 대부분 패기해야 할겁니다. UPS 교채하다가 발생한 불이라는데 UPS가 서버실에 있거나 혹은 근처이 있을테니.. 대부분 서버는 거의 패기될듯합니다.

그리고 경험상 서버실은 보통 연속된 층을 사용합니다. 3층에 서버실이있으면 위아래층 연달아서 서버실이 있다는 소리고, 화재가 나면 영향을 많이 받겠죠.


건물에 서버가 얼마나 있을까 생각해봅니다. 보통 데이터센터 하면 건물의 층단위로 서버가 있습니다.

적게 잡아 3층 규모로 서버가 있다고 가정한다면 백여대가량의 서버가 있을겁니다.

더 있을수도 있습니다.


냉장고 크기만한 서버가 백여대가 있다는 소리인데..

이 장비가 보통 억대입니다. 십억대가 넘어가는 장비도 수두룩 빡빡합니다.

해당 장비는 보통 쉽게 공수 할수 없습니다. 제의 경험을 말씀드리면,

해당 장비들은 고가이고 국내에 여유분이 거의 없습니다. 대부분 외산서버들을 사용하고 (IBM장비가 많습니다.)

PC처럼 정형화되어 있지도 않습니다. 

해당 서버를 구입하면 해외에서 배타고, 혹은 비행기타고 옵니다.

장비 수급이 빨라도 주단위가 걸립니다.


기존 시스템의 SW와 DB 백업본이 있다면

현재 남아 있는 유휴 장비(개발서나 테스트서버) 들에다가 해당 서비스 올려서 임시로.. 급한 서비스들을 올릴수는 있습니다만,

이게 쉽지 않을겁니다. OS도 동일해야 하고, 기본 SW들도 유사하게 맞춰야 합니다. JDK버전만 달라도 안되고, 오라클도 버전다르면 안됩니다. 똑같이 맞춰야 합니다. 오래된 시스템들도 많아서 JDK 1.4를 사용하거나 오라클도 9i 사용하고 그런 시스템도 많습니다... 이거 다 맞춰야 합니다.

장비도 다 똑같은게 아나라 IBM용 HP용 Sun용 윈도우서버 매우 다양하게 포진되어 있을텐데...

이거 서비스 올리려면 장비 + OS버전 + SW 다 맞춰야 합니다.. 휴.


다른 SDS건물 총 동원해도 장비구하기도 넉넉치 않을꺼고,,

개발서버나 사용빈도 낮은 장비를 임시로 사용한다고 해도 셋팅하고 SW올리고 DB올리고... 휴..

그리고 네트웍 다시 구성해야 하고... 이게 SDS만의 문제도 아니라 KT나 데이콤 회선 사용하는데,

이쪽에 요청하고 난리도 아니겠군요.. 대역폭 확보해야 하니 회선을 다시 깔아야 할지도 모르겠고,

네트웍 장비들 셋팅과 복구도 장난아니겠군요.



신문기사에는 1주이상 걸릴꺼다 라고 하는데,

중요 몇개의 서비스 복구는 빨라야 그정도 걸릴수 있을텐데, 기존 사용하던 대부분의 시스템을 원상복구하려면 월단위의 시간이 필요해 보입니다. 아니 이 장비와 인력이 들어갈 건물은 또 어디서 공수할지...


서버이전 몇번 해본 경험을 보면,

금융권같은 경우 짤게는 1달에서 길게는 몇달씩 잡습니다. 단순 서버이전만 하는데요..


내가 담당자라면 맨붕 몇번씩 올거 같네요..