사진=카카오 제공
사진=카카오 제공
정부가 지난달에만 세 차례 발생한 카카오톡 오류 사태의 원인을 발표했다. 각종 업데이트 과정에서 서비스 장애 가능성을 식별하지 못했거나 사전 통제를 제때 하지 못했다는 것이다. 하지만 카카오는 당시 "장애로 볼 수 없다"는 해명을 내놓으면서 구체적 원인을 알리지 않았다.

카톡 오류 세 차례 이어져도 구체적 설명 無

3일 과학기술정보통신부에 따르면 카카오톡에선 지난 한 달간 세 차례에 걸쳐 장애가 발생했다.

지난달 13일 오후엔 약 6분 동안 카카오톡 이용자 중 80%가 메시지 수·발신이 이뤄지지 않는 불편을 겪었다. 카카오톡 PC 버전의 경우 로그인이 되지 않았다. 카카오는 당시 "내부 시스템 작업 중 일부 이용자에게 불안정한 현상이 발생했다"고 설명했다. 그러면서 '카카오톡 장애'에 해당하는 오류는 아니라고 선을 그었다.

한 주 뒤인 같은 달 20일 오후 카카오톡은 또다시 약 6분간 메시지 수·발신이 되지 않았다. PC 버전 로그인도 막혔다. 해명 역시 같았다. "내부 시스템 오류" 때문이라는 것이었다. 불과 하루 뒤인 21일엔 54분간 오류가 발생했다. 출퇴근 시간대인 오전 8시30분부터 9시24분까지 카카오톡 메시지 수·발신이 지연됐고 PC 버전에선 로그인이 되지 않았다.

카카오 측은 카카오톡 오류가 세 차례나 발생하는 동안 "내부 시스템 오류"라는 간단한 입장만 내놨다. 오류 원인에 관한 구체적 설명을 하지 않았다. 오류 발생 원인에 대한 질문에는 "근본적으로 따로 원인이 있진 않다. 시스템 오류는 오류 자체에 원인이 있다기보다는 사실 늘상 발생할 수 있는 것"이라고만 답했다.

정부 점검서 카톡 오류 상세 원인 확인

하지만 과기정통부 점검 결과 오류가 발생한 구체적 원인이 드러났다.

1차 장애 땐 카카오톡 서비스가 운영되고 있는 데이터센터 서버 파일을 업데이트하는 작업 도중 기존 파일을 삭제하는 과정에서 오류가 발생했다고 설명했다. 카카오는 이때 실제 작업을 진행하기 전 사전테스트를 실시하지 않아 발생 가능한 오류에 대비 못한 것으로 확인됐다.

2차 오류는 네트워크 부하 분산을 위한 내부 시스템 기능 개선 작업을 하던 중 발생한 오류로 파악됐다. 작업 전 사전테스트를 실시했지만 개발 결과물의 테스트 환경이 실제 카카오톡 운영 환경과 차이가 커 미리 장애 가능성을 식별하지 못했던 것으로 보인다.

3차 오류는 전날 장애를 일으킨 서버 오류를 해결하지 못한 상태에서 동일 데이터센터에 있는 다른 서버에 자바(Java) 프로그램 업데이트를 진행한 게 원인이 됐다. 내부적으로 작업 통제를 하지 않고 새로운 작업을 진행해 오류가 발생했다.

과기정통부는 주요 작업 전 사전테스트 체계와 작업관리 통제를 강화할 수 있도록 시정을 요구했다. 장애 발생에 따른 매뉴얼을 보완해야 한다는 내용도 포함됐다. 카카오는 1개월 안에 시정 조치 계획을 내야 하며 3개월 안으로 시정 결과를 제출해야 한다.

설명 없던 카카오 "과기부 점검 결과 수용"

카카오는 핵심 서비스인 카카오톡에서 한 달간 세 차례나 장애가 발생했는데도 별다른 입장을 내지 않았다. 위기관리 분야에선 기업이 사과전략을 취할 경우 집단소송 등 경제적 비용을 부담하는 것으로 인식한다.

실제로 카카오는 2022년 10월 데이터센터 화재로 인한 먹통 사태 때는 사고 당일 1차 사과 공지를 낸 뒤 나흘 뒤에 공식 사과문을 발표했다.

이 사과 이후 한 택시기사와 시민단체는 카카오를 상대로 손해배상 청구 소송을 제기했다. 법원은 "카카오는 먹통 사태에 유감을 표하고 재발 방지를 위해 노력하라"는 강제조정 결정을 내놨지만 카카오가 불복하면서 정식 재판이 진행되고 있다.

카카오는 이번 과기정통부 점검 결과 발표가 있고 나서야 "작업 관리 및 감독이 미흡했다는 과기정통부의 점검 결과를 겸허히 수용한다"고 밝혔다. 이어 "그간 서비스 이중화 등 적극적인 기술적 조치를 통해 장애에 적극 대응해 왔으며 앞으로 주요 작업에 대한 내부 관리·감독 프로세스 역시 재정비하고 강화할 계획"이라고 덧붙였다.

김대영 한경닷컴 기자 kdy@hankyung.com