과기정통부, ‘KT 네트워크 장애 원인 분석 결과’ 발표...작업관리자 없이 협력업체 직원만 작업
29일 조경식 과학기술정보통신부 2차관이 최근 발생한 KT 대규모 네트워크 장애 사고에 대한 조사 결과를 발표했다. [사진제공=연합뉴스][더파워=최병수 기자] 지난 25일 전국적으로 1시간 이상 발생한 KT의 대규모 네트워크 장애 사고는 KT의 부실 관리 및 기술적 문제점에 따른 것으로 나타났다.
특히 KT는 작업관리자 없이 협력업체 직원들끼리만 작업하도록 하는 등 부실 관리했고 사전 검증 단계에서는 오류를 찾아내지 못했던 것으로 드러났다.
29일 과학기술정보통신부(과기정통부)가 발표한 ‘KT 네트워크 장애 원인 분석 결과’에 따르면 부산국사에서 기업 망 라우터 교체 작업을 하던 작업자가 잘못된 설정 명령을 입력했고 이후 라우팅 오류로 인해 전국적인 인터넷 네트워크 장애가 발생했다.
KT의 대규모 네트워크 장애 사고 이후 과기정통부는 정보보호 및 네트워크 전문가 등으로 구성된 사고조사반을 구성해 사고 원인 조사에 착수했다.
사고조사반이 이번 사고를 조사·분석한 결과 당초 KT 네트워크관제센터는 야간작업(01시~06시)을 승인했지만 실제 작업은 주간에 수행됐다. 이어 이때 작업 도중 대규모 네트워크 장애가 발생한 것으로 확인됐다.
또한 이 때 작업현장에는 작업 관리자 없이 협력업체 직원들만 라우팅 작업을 수행하는 등 작업오류를 방지하기 위한 작업관리체계가 부실했던 것으로 파악됐다. 아울러 이들은 네트워크가 연결된 채로 작업을 수행했다.
라우팅 작업계획서상의 라우팅 설정 명령어 스크립트에서 IS-IS 프로토콜을 종료하는 ‘exit’ 명령어가 누락됐음에도 KT는 스크립트 작성과정 및 사전 검증 과정에서 이를 발견하지 못했던 것으로 드러났다.
여기에다 네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드도 없었으며 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 전혀 없었다.
KT가 최초 주장했던 DDoS(디도스) 공격 여부에 대해선 현실성이 없는 것으로 결론났다. 사고조사반 조사 결과 DNS 서버에 대한 트래픽 증가는 있었지만 시스템 자원 DDoS 공격 및 네트워크 대역폭 공격은 확인되지 않았다.
과기정통부는 이번 조사 결과를 바탕으로 주요통신사업자 네트워크의 생존성·기술적·구조적인 대책이 담긴 ‘네트워크 안정성 확보방안’을 마련하기로 했다.
이를 위해 과기정통부 네트워크정책실장을 단장으로 네트워크 전문가 등과 태스크포스(T/F)를 꾸려 운영할 방침이다.
이와함께 단기 대책으로 주요 통신사업자을 상대로 네트워크 관리체계 점검, 네트워크 작업으로 인한 오류 여부 사전 진단 시뮬레이션 시스템 도입, 네트워크관제센터의 기술적 점검 체계 구축, 라우팅 작업시 한 번에 업데이트되는 경로정보 개수 제한 등을 검토한다.
중장기 대책으로는 주요 통신사업자를 대상으로 통신장애 대응 모니터링 체계 강화, 네트워크 안정성·복원력을 향상 기술 개발, 안정적인 망구조 등 네트워크의 생존성 확보를 위한 구조적 대책 마련 등을 추진할 계획이다.
KT는 대규모 네트워크 장애 사태로 피해를 입은 이용자들을 위해 피해현황 조사 및 피해구제 방안 마련을 추진할 방침이다.
방송통신위원회는 KT의 이용자 피해구제 방안 이행 여부를 점검할 예정이다.
방통위는 이번 사례와 같은 대규모 통신장애 발생 시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안도 검토하기로 했다.
news@thepowernews.co.kr