전문가들 네크워크 장비 바꾸다 사흘씩 먹통?…복구 매뉴얼 있나
자유인79
IT과학
35
543
2023.11.19 19:40
'서버 트래픽 분산·통신 장애 복구' 네트워크 SW 업데이트 오류인 듯18일 오전 서울의 한 구청 종합상황실에 설치된 무인민원 발급 기기가 정상작동하고 있다. 전날 전국 지방자치단체 행정전산망 '세올'에서 발생한 전산 오류로 지자체 업무와 함께 행정복지센터 민원 업무 처리도 어려움을 겪은 가운데 이날 오전 9시부로 정부 온라인 민원서비스 '정부24'가 복구돼 서비스를 재개했으며, 구청 등에 설치된 무인민원 발급 기기도 정상 작동하는 것이 확인됐다. 2023.11.18/뉴스1 ⓒ News1 박정호 기자
(서울=뉴스1) 오현주 박우영 기자 = 17일 발생한 정부 행정전산망 마비 사태는 스위칭 네트워크(NW) 장비 'L4'(엘포)의 소프트웨어(SW) 업데이트 오류인 것으로 분석된다. 정보기술(IT) 업계에선 이런 종류의 오류로 사흘씩이나 장애가 이어진 데 대한 비판과 함께 비상 사태에 대비한 매뉴얼이 미흡하거나 제대로 작동하지 않은 게 아니냐는 지적이 나온다.
19일 행정안전부에 따르면 전국 지방자치단체 행정전산망 '새올'과 정부 온라인 민원 플랫폼 '정부24'가 이날 오전 시험 테스트 작업에서 정상 작동했다.
2002년 전자정부가 출범한 뒤 공공 행정망이 장기간 마비된 것은 사실상 이번이 처음이다. 지난해 10월 국세청 통합 전산망 접속 오류는 2시간30분 만에 해결됐다.
이번 사태는 네트워크 장비 SW를 업그레이드하면서 불거진 것으로 파악된다. 일종의 '인적 오류'(휴먼 에러)다. 새올과 정부24의 서버·네트워크 장비가 있는 행안부 산하 국가정보자원관리원에서 16일 내부 장비 교체 작업을 한 것으로 알려졌다. 매년 해야 하는 행정전자서명 인증관리센터(GPKI) 인증 갱신을 위해서다.
문제가 된 스위칭 장비는 'L4'다. 스위칭은 목적지로 출발한 데이터를 중간에 적합한 경로로 설정(라우팅)해 트래픽을 분산하고 통신 속도를 높이는 기술이다. 특히 'L4'는 서버 로드 밸런스(하나의 서버가 처리해야 할 업무량을 여러 개의 서버로 나눠 처리) 도구 역할을 한다. 통신 장애가 생기면 빠른 복구를 돕는 중요한 장치다.
업계 관계자는 "장비 업그레이드 작업은 대부분 협력사 직원들이 하는 경향이 있는데, 담당자들의 이직이 잦은 편"이라며 "내부 업무 절차나 규정을 잘 지키지 않고 실수를 했을 가능성이 있다"고 말했다.
재발 방지를 위해서는 발주처와 유지 보수 업체의 높은 네트워크 이해도가 필요하다고 본다. 또 다른 업계 관계자는 "해당 업무 담당자 중에서 전체 네트워크 구성도를 알고 그릴 수 있는 사람이 많지 않다"고 지적했다.
정부가 서비스 장애 복구 매뉴얼 구성을 원점에서 바라봐야 한다는 지적도 있다. 한 서버 구축 전문가는 "스위칭 장비 서버는 라우터에 밀착돼어 있어 시스템이 꺼져도 전원을 가동하면 문제가 생각보다 빨리 해결되는 편"이라며 "사전 대응책 준비가 부족한 게 초유의 장기간 접속 오류를 빚었다"고 진단했다.
이성엽 고려대 기술경영전문대학원 교수는 "네트워크 안정성 (유지)를 위한 충분한 준비가 안 되어 있었던 것 같다"며 "어떤 보안 조치들이 부족했는지 냉정하게 따져봐야 할 때"라고 말했다.
정부는 현재 정확한 원인을 조사하고 있다. 행안부 관계자는 "L4 내부 많은 프로그램과 솔루션을 분해하고 있다"며 "눈에 보이지 않는 통신 프로그램, 패치 등을 하나하나 뜯어보고 있고, (뚜렷한 원인 파악까지는) 시간이 많이 걸릴 것"이라고 말했다.
(서울=뉴스1) 오현주 박우영 기자 = 17일 발생한 정부 행정전산망 마비 사태는 스위칭 네트워크(NW) 장비 'L4'(엘포)의 소프트웨어(SW) 업데이트 오류인 것으로 분석된다. 정보기술(IT) 업계에선 이런 종류의 오류로 사흘씩이나 장애가 이어진 데 대한 비판과 함께 비상 사태에 대비한 매뉴얼이 미흡하거나 제대로 작동하지 않은 게 아니냐는 지적이 나온다.
19일 행정안전부에 따르면 전국 지방자치단체 행정전산망 '새올'과 정부 온라인 민원 플랫폼 '정부24'가 이날 오전 시험 테스트 작업에서 정상 작동했다.
2002년 전자정부가 출범한 뒤 공공 행정망이 장기간 마비된 것은 사실상 이번이 처음이다. 지난해 10월 국세청 통합 전산망 접속 오류는 2시간30분 만에 해결됐다.
이번 사태는 네트워크 장비 SW를 업그레이드하면서 불거진 것으로 파악된다. 일종의 '인적 오류'(휴먼 에러)다. 새올과 정부24의 서버·네트워크 장비가 있는 행안부 산하 국가정보자원관리원에서 16일 내부 장비 교체 작업을 한 것으로 알려졌다. 매년 해야 하는 행정전자서명 인증관리센터(GPKI) 인증 갱신을 위해서다.
문제가 된 스위칭 장비는 'L4'다. 스위칭은 목적지로 출발한 데이터를 중간에 적합한 경로로 설정(라우팅)해 트래픽을 분산하고 통신 속도를 높이는 기술이다. 특히 'L4'는 서버 로드 밸런스(하나의 서버가 처리해야 할 업무량을 여러 개의 서버로 나눠 처리) 도구 역할을 한다. 통신 장애가 생기면 빠른 복구를 돕는 중요한 장치다.
업계 관계자는 "장비 업그레이드 작업은 대부분 협력사 직원들이 하는 경향이 있는데, 담당자들의 이직이 잦은 편"이라며 "내부 업무 절차나 규정을 잘 지키지 않고 실수를 했을 가능성이 있다"고 말했다.
재발 방지를 위해서는 발주처와 유지 보수 업체의 높은 네트워크 이해도가 필요하다고 본다. 또 다른 업계 관계자는 "해당 업무 담당자 중에서 전체 네트워크 구성도를 알고 그릴 수 있는 사람이 많지 않다"고 지적했다.
정부가 서비스 장애 복구 매뉴얼 구성을 원점에서 바라봐야 한다는 지적도 있다. 한 서버 구축 전문가는 "스위칭 장비 서버는 라우터에 밀착돼어 있어 시스템이 꺼져도 전원을 가동하면 문제가 생각보다 빨리 해결되는 편"이라며 "사전 대응책 준비가 부족한 게 초유의 장기간 접속 오류를 빚었다"고 진단했다.
이성엽 고려대 기술경영전문대학원 교수는 "네트워크 안정성 (유지)를 위한 충분한 준비가 안 되어 있었던 것 같다"며 "어떤 보안 조치들이 부족했는지 냉정하게 따져봐야 할 때"라고 말했다.
정부는 현재 정확한 원인을 조사하고 있다. 행안부 관계자는 "L4 내부 많은 프로그램과 솔루션을 분해하고 있다"며 "눈에 보이지 않는 통신 프로그램, 패치 등을 하나하나 뜯어보고 있고, (뚜렷한 원인 파악까지는) 시간이 많이 걸릴 것"이라고 말했다.