[데이터로 보는 세상] ‘통계데이터처’ 설치, 왜 필요한가

부처간 통계 칸막이 제거해야

우리는 지금 4차 산업혁명시대에 살고 있다. 그 주요 기술들인 빅데이터, 인공지능, 사물인터넷, 메타버스, 클라우드 등이 모두 데이터 기반의 디지털 기술들이다. 데이터가 빈약하면 4차 산업혁명 기술에서 절대 앞서갈 수 없다.

즉, 데이터가 국가든 기업이든 미래경쟁력을 좌우하는 ‘데이터 경제’ 시대에 살고 있다. 데이터 경제라는 개념은 유럽연합 집행위원회(EC)가 2017년 발표한 ‘유럽 데이터 경제 육성책(Building a European Data Economy)’에서 제시한 것으로, 데이터 활용이 모든 산업 발전과 새로운 가치 창출에 촉매 역할을 담당하는 시대의 경제라는 뜻이다.

이 육성책의 골자를 보면, 유럽연합 내에서 데이터의 자유로운 공개와 사용을 보장하고, 데이터 분석 역량을 강화해 새로운 비즈니스 모델을 발굴하고, 국가 간 상호 협력하도록 권장하고 있다.

5월 10일 들어선 윤석열 정부의 핵심 공약 중 하나는 ‘디지털 플랫폼 정부’이다. 이 공약은 방대한 통계데이터를 디지털화하고 효율적으로 공유·활용해 국가 경쟁력을 높이겠다는 것이다.

디지털 플랫폼을 통해 데이터 장벽을 허물고 개방하면, 국정 운영에 데이터·과학화 시스템 구축, 국민의 개개인 맞춤형 서비스 구축, 민간 디지털 경제 활성화 등이 가능하다는 것이다.

‘20세기가 원유의 시대라면 21세기는 데이터의 시대’이다. 그러나 데이터는 우리가 당면한 디지털 시대의 원유이지만 꿰어야 보배가 된다. 새 정부가 들어서면서 데이터를 효과적으로 꿰매고 활용해야 데이터 경제를 효율적으로 운영해 성공하는 정부가 가능하다.

그러면 현재 우리나라는 디지털 플랫폼 정부로 가기 위한 준비가 되어 있는가? 그렇지 못하다. 우리나라는 분산형 통계 제도를 채택하고 있다.

국가 승인 통계는 <표 1>에서 보는 바와 같이 2022년 4월 28일 현재 1276종으로 방대하나 431개 작성기관(중앙행정기관 48곳, 지방자치단체 260곳, 공사.공단 37곳 등)에서 생산하고 있고, 작성기관 간에 데이터베이스로 연동된 ‘연계 통계’는 하나도 없는 실정이다.

통계청이 통계법에 의해 국가통계의 승인 및 조정 기능을 가지고 있지만, 권한이 미약하여 직접 생산하는 66종만 제대로 관리하고, 나머지 통계는 부처별로 제각각 운영된다.

이런 상황이라 방대한 통계데이터들이 부처 간 칸막이에 막혀 제대로 활용되지 못한다. 현 상태라면 효과적인 디지털 플랫폼 구축은 불가능하다.

예를 들어보자. 저출산·고령화로 국민연금 고갈 시점이 앞당겨지면서 연금 개혁이 심각한 문제로 대두되고 있으나 개인·가구별 연금 수급 상황을 정확히 파악할 수 있는 ‘포괄적 연금 통계’는 어느 부처에도 없다.

기초연금과 국민연금은 보건복지부, 퇴직연금은 고용노동부, 개인연금은 국세청, 주택연금은 금융위원회 등 연금 종류에 따라 담당하는 부처가 제각각이고, 상호 연계가 안 되다보니 한 고령자 가구가 각종 연금을 합쳐 한 달에 얼마나 받고 있는지에 대한 실태 파악이 정확히 안 된다.

이런 깜깜이 정보로 어떻게 객관적인 데이터 기반 연금 개혁이 가능하겠는가? 또한 우리나라는 노인 빈곤율이 OECD 국가 중 1위이고, 노인 빈곤율 해소가 급선무이다. 그러나 전문가들은 고령층 소득이 제대로 파악되지 않은 것을 지적한다.

고령층 소득은 국세청 소득자료, 국민연금 등 4대 보험 자료, 보건복지부 복지 통계 자료, 통계청의 인구주택총조사 자료 등이 연계돼야 정확히 파악이 가능하나 부처 간 칸막이가 심해 정확한 파악이 불가능하다. 이외에도 우리나라는 국가적 과제인 인구절벽, 탄소중립, 유엔 지속가능발전목표(SDGs) 등에 대한 포괄적 연계 통계 작성에도 애로 사항이 많다.

데이터가 산업 발전의 기본

우리나라 부처 간 통계데이터의 칸막이를 제거하려면 소위 ‘데이터 컨트롤타워’ 기능을 하는 조직이 필요하다. 현재의 상태에서 최선의 방법은 기재부 외청으로 있는 통계청을 ‘통계데이터처(가칭)’로 조직 개편하여 모든 부처를 관장할 수 있는 국무총리실 직속으로 옮기는 것이 가장 좋은 방법이다.

새 정부가 염두에 두고 있는 총리실의 총괄·조정 기능 강화를 뒷받침하는 데도 도움이 되고 증거 기반(evidence -based) 국정 운영에도 큰 역할을 할 것이다. 통계청이 기재부 산하에 있는 것도 시대의 변화에 따르지 못한다고 할 수 있다.

경제 통계가 가장 중요한 과거 시절에는 기재부가 적절했지만 지금은 보건, 농림수산, 과학기술, 정보통신, 교육문화, 환경 등의 통계가 모두 중요한 시기가 되었다. 통계청이 생산하는 66종의 통계 중에도 단 20개만이 경제 통계이다.

세계 주요 국가들의 데이터 정책을 살펴보자. 오늘날과 같이 세계적으로 데이터 기반 지능정보화 사회로 가고 있는 시점에 미국을 비롯한 주요 국가들의 데이터 관련 정책은 어떠한가? 한국데이터산업진흥원(KDATA)이 발간한 ‘2019 데이터 산업 백서’를 보면 이와 관련 자료들이 일부 있음을 밝혀둔다.

미국은 이미 오바마 정부 시절인 2009년부터 오픈데이터 정책을 위해 www.data.gov 서비스를 시작해 2019년 말 기준 25만개 이상의 데이터 세트가 여기에 등재되어 일반인에게 개방되어 있다. 또한 2012년에는 대통령 직속 ‘빅데이터 협의체’를 만들어 다양한 부처가 참여해 협업이 잘 이뤄지고 있다.

2014년에는 정부의 재정 데이터 투명성 제고를 위해 ‘Data Act of 2014’를 제정했다. 2019년에는 공공데이터 개방을 권장하는 ‘OPEN Government Data Act’를 제정했다. 빅데이터의 수집과 활용을 위해 2015년부터 4개의 빅데이터 지역혁신 허브를 둬 운영한다.

빅데이터 등 데이터의 수집·정리·활용 등을 연구하는 데이터과학(data science)의 진흥과 활용에서도 미국이 앞서가고 있다. 2021년 11월 현재 미국에서 데이터과학 학위 프로그램을 가진 대학의 수가 학사과정 273개교, 석사과정 376개교, 박사과정 57개교로 많으며, 데이터과학자(data scientist)들을 다수 양성하고 있다.

데이터과학 교육은 석사과정을 중심으로 이뤄지고, 석사과정을 가진 대학 리스트는 https://www.mastersportal.com 에서 찾아볼 수 있다.

유럽연합(EU)은 미국에 뒤처진 데이터산업 경쟁력을 확보하기 위해, EU의 유수한 ICT 기업(Nokia, SAP, Siemens 등)과 독일 인공지능연구센터, 베를린 공대, 이탈리아 로냐대 등 연구기관과 대학이 회원사로 있는 빅데이터가치협회(Big Data Value Association)에 재정 지원하여 2016년부터 민관 빅데이터 연구 및 혁신 등에 투자하고 있다.

EU는 또한 2017년에는 ‘유럽 데이터 경제 육성책’을 발표하여 데이터 경제 활성화를 촉진한다. 2018년에는 ‘개인정보보호규정(GDPR)’을 제정하여 개인정보의 보호와 이용의 가이드라인을 제공한다. 개인정보 보호 차원에서는 유럽이 앞서가고 있다.

영국은 데이터 오픈 정책에서 세계적인 리더이다. 미국의 월드와이드웹(WWW) 재단에서 발표한 2017년 ’제4차 오픈데이터 글로벌 보고서(ODB Global Report Fourth Edition)’에 의하면, 국가별 오픈데이터 지료 순위에서 총 114개국 중에서 영국이 1위(2, 3, 4위는 각각 캐나다, 프랑스, 미국)였다.

영국은 이미 2011년 선도적으로 ‘디지털서비스청’을 만들어 디지털 사회에 대비하여 데이터 서비스를 제공하고 있다. 영국이 2010년에 시작한 공공데이터 포털사이트(data.gov.uk)에는 2019년 6월말 현재 5만1173개의 데이터 세트가 올라와 있으며 데이터 활용을 위한 소프트웨어 애플리케이션도 함께 제공된다.

미·일 등 오픈 데이터 정책 추진

일본은 2012년 ICT 활성화 전략인 ‘액티브 재팬 전략(Active Japan ICT)’의 5대 중점 분야의 하나로 ‘액티브 데이터 전략’을 수립하고, 데이터 관련 법률을 개정하는 등 적극적으로 데이터 활용 정책을 추진한다.

2015년 ‘개인정보 보호에 관한 법률’을 개정해 가명정보(개인의 기본적인 식별 자료가 삭제된 정보)와 익명정보(완전히 개인을 유추할 수 없을 정도로 개인 자료가 삭제된 정보) 개념을 도입해, 가명·익명 정보를 개인의 동의 없이도 상품, 서비스 개발 뿐 아니라 제3자 판매도 가능하도록 했다.

‘미래투자전략 2017’에 의하여 새로운 사회 인프라로 데이터 기반 플랫폼을 구축하고, 데이터 활용을 촉진하기 시작하였다. 현재 일본 정부는 공공데이터 플랫폼(data.gov.jp)을 운영한다.

2019년 6월 말 기준 총 2만5000개의 데이터 세트가 등재되어 있다. 메타데이터(어떤 목적을 가지고 만들어진 데이터)를 종류별로 일괄 다운로드할 수 있는 기능을 제공한다.

중국은 2015년 8월 국무원에서 ‘빅데이터 발전 촉진을 위한 행동 강요’를 리커창 총리 주재 하에 개최된 상무회의에서 통과시켰다. 빅데이터 발전이라는 전 세계적인 변화에 발맞추고자 하는 강력한 의지를 천명했다.

공공데이터의 개방, 데이터의 활용 극대화, 데이터 산업 활성화 등을 밝혔다. 중국은 2016년 ‘제3차 5개년 규획’, 2017년 ‘빅데이터산업 발전 계획’ 등을 발표하면서, 빅데이터 시스템 표준화를 강화하고, 빅데이터 관련 산업을 육성한다.

2017년 계획은 2020년까지 빅데이터 관련 제품 및 서비스 시장 규모는 1조 위안, 연평균 성장률은 30%를 유지하고, 10개 이상의 글로벌 선두 빅데이터 기업을 육성하고, 500개 이상의 응용서비스 기업을 발굴하겠다는 내용도 담고 있다.

중국은 정부 주도로 빅데이터 산업 발전계획을 세워 일사불란하게 빅데이터 기술을 진흥시키고 있으나, 개인정보 보호는 잘 지켜지지 않아, 빅데이터 기반의 ’사회 신용 시스템‘을 국가가 구축하여, 각 개인에게 사회 신용 번호를 부여해 신용도에 따라 혜택이나 불이익을 주는 제도가 있다.

지구촌에서도 데이터 산업의 글로벌화가 진행되고 있으며, 최근 데이터 기반 디지털 교역이 통상의 이슈로 부각되는 상황이다. 따라서 데이터의 국제 이동 관련 제도를 정비할 필요가 발생한다.

예를 들어 보자. 한국 기업들은 비즈니스 확장을 위해 세계 각지에서 상품 기획, 연구개발, 유통, 마케팅 등 타국의 전자상거래 플랫폼이나 개인정보 등을 적극 활용해야 한다. 주요 교역국과 이런 활동에 필요한 데이터를 원활하게 주고받을 수 있느냐는 글로벌 비즈니스의 핵심 요소가 되어가고 있다.

우리 기업들이 자유롭게 전 세계 데이터 교환에 참여할 수 있는 기반을 마련하기 위해서도 정부의 데이터 컨트롤타워가 권한을 가지고 국제적으로 데이터 활용이 가능하도록 행정적인 조치를 취할 필요가 있다.

데이터 활용 측면에서 문재인 정부도 많은 노력을 했다. 문 대통령은 2020년 7월 14일 청와대에서 ‘한국판 뉴딜 국민보고대회’를 열고 “한국판 뉴딜은 선도 국가로 도약하는 대한민국 ‘대전환 선언’이자 ‘새로운 100년의 설계’”라고 천명했다.

‘한국판 뉴딜’은 ‘디지털 뉴딜, 그린 뉴딜, 안전망 강화’로 구성되며, 이 중 디지털 뉴딜은 <표 2>의 대표 과제들로 구성되어 데이터 기반 사회를 구축하기 위함이다.

우리나라는 정부의 전자 시스템 발달 수준이 높은 나라로서, 공공데이터의 개방에 관한 정부의 움직임이 꾸준히 진행되고 있다. 그러나 대부분의 데이터들은 관계부처와 지자체들에서 기관별로 보유하고 있으며, 민간기업과 정부의 데이터 연계도 아직 미진하다.

공공데이터에 대해서는 행정안전부 한국정보화진흥원(NIA)에서 2015년부터 운영하는 범정부 데이터 플랫폼인 공공데이터포털(https://www.data.go.kr)이 있는데, 여기에는 2020년 6월 기준 파일 데이터 3만1759건, 오픈 API(Application Program ming Interface) 5589건, 표준데이터 120건이 공개되어 있다.

이외에도 통계청 통계데이터센터(https://data.kostat.go.kr) 에서도 2017년부터 행정통계자료와 일부 민간자료를 모아 이용자들에게 서비스하고 있다.

그러나 데이터 시장 규모가 매우 빠르게 커지고 있고, 오늘날 지능형 네트워크 사회에서는 정부의 데이터 서비스는 만족할만한 수준이 안 된다. 디지털 뉴딜은 매우 의욕적인 시도라고 생각하며, 이런 좋은 시도는 윤석열 정부에서도 계승할 필요가 있다.

암호 도입하면 안전한 통계 활용 가능

데이터 컨트롤타워에서 모든 공식통계를 모으면 개인정보 보호가 위협 받고, 분산형 통계제도에서 각 통계작성기관의 권한과 기능이 훼손될 수 있다는 우려를 제기하면서 데이터가 집중되는 디지털 플랫폼의 역기능을 염려하는 목소리도 있다. 그러나 이런 염려를 극복할 수 있는 많은 방안들이 연구되고 있다.

가장 유력한 방법은 데이터 컨트롤타워에 통계등록부(hub)가 있고, 각 통계 작성기관이 보유한 데이터(spokes)를 동형암호 등 가장 최신의 정보기술로 연결하고, 암호화한 상태에서 안전하게 분석하는 틀을 만드는 것이다. 이렇게 하면 각 기관이 만든 데이터를 한 곳에 모을 필요도 없다.

데이터 보유기관은 자료를 자신의 데이터 센터 밖으로 내주지 않고 연결할 수 있도록 협조만 하면 된다. 이런 방식을 허브-스포크(hub and spokes) 모형이라고 부르며, 국제적으로 많은 연구와 진전이 이뤄지고 있다.

자료 연계와 자료 분석을 암호화한 상태에서 하고, 그 암호화된 분석 결과도 안전하게 관리할 수 있다. 이런 이치는 은행의 개인 금고를 열 때 은행이든 개인이든 혼자서는 열 수 없고, 둘이 합심해야만 열 수 있는 것과 같다.

이렇게 하면 개인정보보호 문제로 자료 제공을 거부하던 개별 부처의 명분도 사라지고, 자료를 만드는 통계작성기관의 기능도 계속 보호되게 된다. 이런 허브-스포크 모형은 데이터 비밀보호 기능이 탑재된 사실상의 디지털 플랫폼 역할을 수행하게 되어 국정 운영에 꼭 필요한 기관 간 자료 연계 및 부처 간 협업을 가능하게 할 것이다.

시대가 데이터 경제 시대로 접어들면서 우리나라도 발 빠르게 새 정부에서 ‘통계데이터처’의 설립을 심각하게 고려할 때가 되었다. 이를 통하여 데이터 산업이 발전하고 4차 산업혁명 기술에서 앞서 간다면 국가경쟁력 제고에도 큰 도움이 될 것이다.

데이터 컨트롤타워로서의 ‘통계데이터처’의 설치는 디지털 플랫폼 정부의 필수적인 성공의 열쇠이다. 이를 통해 우리나라가 증거 기반 국정과제들을 효율적으로 운영해 국민의 권익을 신장하고, 국가경쟁력을 제고해 명실공히 선진국의 반열에 들어갈 수 있기를 바란다.

본 기사는 시사주간지 <미래한국>의 고유 콘텐츠입니다.
외부게재시 개인은 출처와 링크를 밝혀주시고, 언론사는 전문게재의 경우 본사와 협의 바랍니다.

트윗하기

박성현 미래한국 편집위원·서울대 통계학과 명예교수 다른기사 보기