"할 수 있는 이중화 모두 다했다"…카카오 데이터센터 안산 가보니

카카오의 첫 자체 데이터센터
"2022년 10월 서비스 먹통 트라우마…안정성 최우선으로"
모든 운영설비 이중화하고 데이터, 운영 도구 다중화
원전 수준 내진 설계도 적용
화재대응시스템 자체 개발하고 특허 출원
“데이터센터를 만들면서 ‘이것도 이중화해요?’라는 말을 가장 많이 들었다.”(고우찬 카카오 인프라기술 성과리더)

카카오는 지난 11일 경기 안산시 한양대 에리카캠퍼스 내 ‘카카오 데이터센터 안산’에서 언론 대상 공개 행사를 열었다. 카카오 데이터센터 안산은 연면적 4만7378㎡ 규모의 하이퍼스케일 데이터센터다. 4000개의 랙을 갖춰 총 12만 대의 서버를 보관할 수 있다. 이를 통해 6엑사바이트(EB)의 데이터를 저장할 수 있다. 작년 9월 데이터센터를 준공했고 올해 1월 가동을 시작했다.데이터센터 건립이 한창이던 2022년 10월 SK판교데이터센터 화재로 이곳에 데이터를 저장하던 카카오 서비스 대부분이 며칠 동안 먹통이 되는 사태가 벌어졌다. 카카오 내부에서 이른바 ‘1015 사태’로 불리는 일이다. 올해 3월 취임 후 기자들과 처음 만난 정신아 카카오 대표는 “우리에게는 트라우마 같은 뼈아픈 상황이었다”며 “데이터센터를 원점부터 재검토해 완공일까지 설계와 시스템을 끊임없이 보완하고 고민했다”고 말했다.

실제로 카카오가 가장 신경 쓴 분야는 안정성이다. 어떠한 상황에도 무중단 운영이 가능하도록 시스템을 구축했다. 전력회사로부터 전기를 공급받는 전력망부터 서버에 전기를 최종적으로 공급하기까지의 전 과정과 통신회사에서 서버까지 통신을 제공하는 과정, 냉동기부터 서버실까지 냉수 공급망 등 모든 운영설비를 이중화했다. 데이터와 운영 도구 등은 다중화했다. 일부 시스템에 문제가 생겨도 이용자가 체감하는 불편을 최소화하고 복구 시간을 최대한 줄일 수 있는 환경을 구축했다.
대규모 서버를 차질 없이 운영할 수 있는 무정전 전력망도 갖췄다. 전력 공급 중단에 대비하기 위해 주전력 100% 용량에 해당하는 전력을 즉시 공급받을 수 있는 예비 전력망을 마련했다. 두 곳의 변전소 모두 문제가 발생해도 비상 발전기를 통해 전력 중단없이 데이터센터를 가동할 수 있도록 설계했다.데이터센터 간 연결과 안정성을 강화했다. 서비스가 이뤄지는 주 데이터센터 외에 물리적으로 이격된 최소 두 곳의 데이터센터에 데이터와 운영 도구 사본을 실시간 업데이트하고 있다. 고 성과리더는 “필요한 모든 계통은 이중화했다”며 “어떤 상황에서도 서비스를 지속할 수 있는 준비가 됐다”고 강조했다.
화재나 지진, 홍수, 해일, 태풍 등 각종 자연재해 및 재난을 견딜 수 있는 강력한 재난 설계도 적용했다. 특히 ‘1015 사태’가 배터리 화재에서 비롯된 만큼 이 부분에 심혈을 기울였다. 화재 조기 진화를 위해 무정전전원장치(UPS)실과 배터리실을 방화 격벽으로 분리 시공하고, 모든 전기 패널에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하게 설계했다. 화재 진압이 어려운 리튬 이온 배터리 화재에 대비해 화재대응시스템을 자체 개발해 적용했다. 특허 출원도 진행 중이다.

카카오가 개발한 화재대응시스템은 4단계로 이뤄졌다. 먼저 배터리에서 화재가 발생하면 내부 감시 시스템이 자동으로 감지해 화재의 영향이 있는 배터리 전원을 차단하고 방염천 등으로 화재 전이를 막는다. 이후 단계적으로 소화 약제를 분사해 초기 진화를 시도하고, 방수천을 올려 냉각수를 지속해서 분사해 발화 원천을 차단한다. 이를 통해서도 불이 꺼지지 않으면 소방서와 연계해 데이터센터 맞춤형 화재 진압을 하게 된다.지진 대응을 위해 내진 설계를 적용했다. 리히터 6.5 이상 강진을 견딜 수 있는 성능을 갖췄다. 국내 원자력발전소 내진설계 기준에 준하는 수준이다. 안산시 지역 최대 풍속을 감안해 28m/s의 강풍도 견딜 수 있도록 대비했다. 홍수 피해로부터 데이터를 지킬 수 있도록 지상 1층 바닥을 주변 지표면보다 1.8m 높이 설계했고 서버와 배터리, UPS 등 주요 설비도 모두 지상층에 배치했다.
카카오는 안정성과 함께 에너지 절감에도 신경을 썼다. 특히 물 사용을 최소화하기 위해 노력했다. 물은 하드웨어의 열을 내리는 역할을 해 전력만큼 많이 사용되는 자원이다. 계절의 변화에 맞춰 3가지 모드로 운전하는 고효율 프리쿨링(Free Cooling) 냉각기 시스템을 적용했다. 빗물과 비상시를 위해 구비해두는 보충수는 조경용수, 소방용수 등으로 재사용해 일반적인 데이터센터 대비 상하수도 비용을 약 98%까지 절약할 수 있다는 설명이다. 고효율 장비와 LED를 사용해 전기 에너지 사용량을 최소화하고 서버를 냉각하고 발생한 폐열을 난방에 재사용한다. 태양광 패널을 외장재 및 옥상에 설치해 전력을 확보 중이다. 총에너지 사용량을 30% 감소시켜 연간 에너지 비용을 31억원 절감할 것으로 예상된다.

지역사회와의 소통도 활발하게 진행 중이다. 운영동 건물의 1~2층을 오픈해 한양대 학생이나 지역 주민들이 자유롭게 드나들 수 있도록 했다. 하반기에는 안산시민을 대상으로 데이터센터 투어도 시범 운영할 예정이다.카카오는 카카오 데이터센터 안산에 이어 신규 데이터센터도 추진한다. 인공지능(AI) 기술 기반 서비스 운영을 포함한 미래 기술환경에 효과적으로 대응할 수 있도록 HPC(하이 퍼포먼스 컴퓨팅) 데이터센터로 특화 설계할 계획이다.
정 대표는 “카카오의 서비스가 전 국민의 일상을 실시간으로 연결하고 있는 만큼 안정성을 최우선으로 두고, 어떠한 재해와 재난에도 멈추지 않는 안전한 데이터센터를 목표로 했다"며 “앞으로 카카오가 선보일 새로운 서비스와 10년 뒤의 기술과 변화를 뒷받침할 수 있도록 인프라에 적극적으로 투자할 것”이라고 강조했다.


안산=이승우 기자 leeswoo@hankyung.com