정부가 이달 들어 3차례 발생한 ‘국민 메신저’ 카카오톡의 서비스 장애 원인을 파악하고 운영사에 시정을 요구했다.
과학기술정보통신부는 카카오에 1개월 이내로 개선 조치계획을 수립해 제출하고, 3개월 이내로 시정결과를 제출하도록 요구했다고 31일 밝혔다.
이에 앞서 과기정통부는 이번 장애에 대한 카카오의 통신재난관리계획 이행 여부를 점검하고, 통신재난관리심의위원회를 열어 카카오의 미흡사항에 대한 시정조치 요구사항을 심의·의결했다.
카카오톡은 지난 13일 오후 1시44분부터 6분간, 20일 오후 2시52분부터 6분간, 21일 오전 8시30분부터 54분간 서비스 장애를 일으켰다.
과기정통부에 따르면 첫번째 장애 발생 당시 카카오톡 이용자의 약 80%가 메시지 발신 지연과 실패로 불편을 겪은 것으로 추정된다. 장애의 원인은 데이터센터 서버의 파일을 업데이트하는 작업 중 기존 파일을 삭제하는 과정에서 오류가 발생했기 때문이다. 과기정통부 점검 결과, 카카오는 실제 작업을 진행하기 전에 사전테스트를 실시하지 않아 발생 가능한 오류에 대비하지 못한 것으로 확인됐다.
두번째 장애는 네트워크 부하 분산을 위한 내부 시스템 기능개선 작업 중 발생한 오류가 원인이다. 이로 인해 이용자의 약 80%가 메시지 수·발신 불편을 겪은 것으로 추정된다. 카카오는 실제 작업을 진행하기 전에 사전테스트는 실시했으나 개발 결과물의 테스트 환경이 실제 카카오톡 운영환경과 차이가 커 미리 장애 가능성을 식별하지 못한 것으로 확인됐다.
가장 길었던 세번째 장애는 당시 카카오톡 이용자의 약 8%에 영향을 미쳤을 것으로 추정된다. PC 카카오톡 로그인 실패, 모바일 카카오톡 메시지 수·발신 지연이 있었다. 이번 장애는 두번째 장애를 일으킨 서버의 오류를 미해결한 상태에서 동일 데이터센터에 있는 다른 서버에 Java 프로그램 업데이트를 진행한 것이 원인이다. 카카오는 내부적으로 작업 통제를 하지 않아 전날 장애가 발생한 서버의 오류를 미해결한 상황에서 통제없이 새로운 작업을 진행한 것으로 확인됐다.
정부는 카카오에 ▲주요 작업 전 사전테스트 체계 강화 ▲작업관리 통제 강화 ▲통신재난 관련 매뉴얼 및 지침 보완 ▲모니터링 시스템 고도화를 통한 장애 탐지 강화 ▲장애 원인분석 및 사후관리 체계화 ▲장애 사실 이용자 고지 개선 등을 요구했다.
이종호 과기정통부 장관은 “디지털서비스 장애는 국민 일상의 불편을 넘어 사회·경제 전반에 지대한 영향을 끼치는 만큼 재발방지를 위해 사업자의 관리체계를 면밀히 점검하겠다”며 “카카오도 국민들의 관심으로 성장한 기업인 만큼 재난·장애 관리를 위한 조직문화 개선과 함께 이용자에게 편리하고 안정적인 서비스를 제공하도록 책임을 다할 필요가 있다”고 강조했다.
이화연 기자 hylee@segye.com