데이터 한곳에 두는 클라우드…사고 터지자 전세계 '속수무책'

글로벌 2위 MS 클라우드 먹통 원인은

보안업체 크라우드스트라이크
"업데이트 도중 오류 발생해"
항공사 발권시스템 피해 커

작년에도 두차례 접속 장애
중앙 집중 시스템 한계 드러내

英 런던거래소도 전산 에러
개막 코앞 파리올림픽 '비상'
< 국내 LCC, 수기 발권 대응 > 미국 마이크로소프트(MS)의 클라우드 서비스를 사용 중인 제주항공과 이스타항공, 에어프레미아 항공권 예약 및 발권 시스템에 19일 오류가 발생했다. 제주국제공항 출발층 발권 카운터에서 제주항공 직원들이 항공권을 수기로 발급하고 있다. /연합뉴스
19일 전 세계에서 벌어진 온라인 플랫폼 장애의 원인은 마이크로소프트의 클라우드 서비스 오류다. 이 회사에 따르면 두 종류의 서비스가 문제를 일으켰다. 하나는 클라우드 보안을 위해 적용한 미국 보안 업체 크라우드스트라이크의 업데이트 오류다. 다른 하나는 전 세계 항공사들이 사용하는 스페인 아마데우스의 발권 시스템 ‘나비테어’다.

○파리올림픽도 비상계획 가동

전 세계적으로 2만 개 이상 고객사를 둔 크라우드스트라이크가 배포한 업데이트 패치가 마이크로소프트 윈도 운영체제(OS)와 충돌한 탓에 이를 사용하던 서버와 PC가 화면에 ‘죽음의 블루스크린’을 띄우며 작동을 멈췄다. 크라우드스트라이크는 이날 오후 8시께 성명문을 통해 “콘텐츠 업데이트 과정에서 결함이 발견돼 수정 작업을 했다”며 “보안 사고나 사이버 공격 영향은 아니다”라고 설명했다.

나비테어는 항공권 예약과 발권 등을 지원하는 승객 서비스 시스템(PSS)이다. 대형 항공사보다는 노선이 많지 않은 지역항공사와 저비용항공사(LCC)가 주요 고객이다. 나비테어는 마이크로소프트의 클라우드 서비스 애저(azure)를 통해 서비스 중이다. 나비테어에 문제가 생기면서 이 시스템을 도입한 전 세계 항공사에서 문제가 동시다발적으로 발생했다.

두 건의 오류는 전 세계적으로 파장을 미쳤다. 항공사는 물론 금융가와 언론계도 혼란에 빠졌다. 영국 보도 매체인 스카이뉴스는 기술적 문제로 이날 오전 한때 생방송 송출을 중단했다. 런던증권거래소(LSE)는 이날 오전 8시에 장을 열었지만, 전날 마감 가격이 그대로 떠 있었다. LSE 모기업인 LSEG가 소유한 뉴스·데이터 플랫폼 워크스페이스가 통신 문제를 겪으면서다. 서던, 템스링크, 개트윅익스프레스 등 영국 철도회사들도 “광범위한 정보기술(IT) 문제로 지연이 예상된다”고 공지했다.호주와 뉴질랜드의 주요 도시에선 항공편 결항은 물론 이동통신, 은행 서비스, 방송 등이 한때 정지됐다. 이스라엘과 독일에선 병원 시스템 이상으로 수술 등이 취소되기도 했다. 오는 24일 개막을 앞둔 파리올림픽도 클라우드 장애의 영향을 받았다. 파리올림픽 조직위원회는 이날 성명을 통해 “전 세계적 사이버 정전 사태로 IT 서비스 운영에 피해가 발생했다”며 “업무를 계속하기 위한 비상계획을 가동했다”고 밝혔다.

○사고 한 번에 전 세계 마비 우려도

호주 시드니 한 슈퍼마켓의 결제 장비에 오류를 알리는 ‘블루 스크린’이 떠 있다. AFP연합뉴스
클라우드는 ‘구름’이라는 단어 그대로 각종 데이터를 기업이나 기관이 보유한 서버가 아니라 외부 서버에 저장하는 기술이다. 이용자 입장에선 직접 서버를 갖춰 운영할 필요 없이 이용한 만큼만 비용을 낼 수 있어 경제적이다. 클라우드는 시간이 지나면서 빠르게 진화하고 있다. 단순히 데이터를 외부 서버에 저장하는 서비스형 인프라(IaaS)에서 클라우드 내에서 각종 소프트웨어를 제공하는 서비스형 소프트웨어(SaaS)로 시장의 중심축이 이동하고 있다. 전사적자원관리(ERP), 고객관계관리(CRM), 공급망관리(SCM) 등 기업용 솔루션 대다수가 SaaS 형태로 제공되고 있다.생성형 인공지능(AI)의 부상과 함께 클라우드의 중요성은 더욱더 커지고 있다. 생성 AI는 학습과 추론에 그래픽처리장치(GPU), 신경망처리장치(NPU) 같은 컴퓨팅 파워가 필요하다. 개인용 컴퓨터나 기업이 보유한 서버에서 이 같은 작업을 수행하기란 사실상 불가능하다. 이 때문에 대부분 생성 AI는 클라우드 형태로 제공된다. 글로벌 3대 클라우드 기업인 아마존웹서비스(AWS), 마이크로소프트, 구글클라우드는 물론 네이버클라우드 같은 국내 업체들도 AI를 구동할 수 있는 하이퍼스케일 데이터센터 건립에 적극적이다.

업계에서는 이번 사고로 클라우드 시스템의 결정적인 단점이 드러났다는 지적이 나온다. 핵심 시스템에 문제가 생기면 해당 클라우드 플랫폼을 활용하는 전 세계의 서비스가 한꺼번에 중단될 수 있다는 점이 확인됐다는 설명이다. 업계 관계자는 “분산형 시스템 설계에 대한 클라우드 고객들의 요구가 본격화될 것”이라고 말했다.

마이크로소프트의 클라우드 서비스는 작년에도 두 차례 접속 문제를 겪었다. 지난해 1월엔 네트워크 연결 문제로 약 90분 동안 애저, 팀즈, 아웃룩 등 다수 서비스에서 접속 장애가 발생했다. 지난해 6월에는 해커집단의 분산서비스거부(DDoS) 공격으로 오피스 제품군과 클라우드 서비스 접속에 문제가 생겼다.

이승우/이주현/김인엽 기자 leeswoo@hankyung.com