과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 디지털 뉴딜 「디지털 댐」의 기초이자 핵심인 인공지능(AI) 학습용 데이터 구축사업의 성공적 추진을 위한 핵심관건인 데이터 품질관리 체계를 글로벌 수준으로 대폭 강화한다고 밝혔다.
- 인공지능(AI) 서비스 개발에 필수적인 인공지능(AI) 학습용 데이터를 대규모로 구축·개방하는 이번 사업은 추경(2,925억원)으로 10대 분야 150종의 데이터를 구축할 계획이며, 지난 8월말 수행기업·기관(총 584개) 선정을 완료하였다.
과기정통부는 활용도 높은 양질의 데이터를 구축하기 위해 품질관리 전담기관(한국정보통신기술협회)을 운영하고 있으며, 자연어·자율주행차 등 분야별로 전문적인 품질검증 지원체계를 마련하기 위해 이번에 전문가들이 참여하는 ‘품질 자문위’를 구성하고 첫 킥오프 회의를 9월 22일 10시 한국정보화진흥원 서울사무소(광화문)에서 개최했다.
- 자문위는 8개 분과*로 운영되며, 분과별로 산·학·연 전문가, 데이터를 활용할 활용기업 등 10명 내외, 전체적으로 총 80여명이 참여한다.
* 자연어처리, 헬스케어, 자율주행, 농축수산, 국토환경, 미디어, 안전, 기타 등 8개 분과
- 자문위는 △데이터 구축계획 타당성, △구축단계별 품질절차 준수, △원시 데이터 및 라벨링 데이터의 품질·활용도 검증 등에 대한 전문적인 자문 역할을 담당할 예정이다.
이날 회의는 위원장으로 선임된 인공지능 분야에 명망이 높은 서울대학교 전기정보공학부 이경무 교수와 분야별 위원장 등이 참석하여 품질관리를 강화하기 위한 다양한 방안을 논의하였다.
한편, 과기정통부는 데이터 품질관리 강화를 위해 △세계 수준의 품질검증 및 유지보수 체계 확립, △사업 수행기관의 품질 역량 및 책임성 대폭 강화를 기본방향으로 ‘품질 자문위 운영’을 포함한 세부적인 방안을 마련하였다.
- 먼저, 기 개발된 ‘인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 데이터의 다양성, 정확성, 유효성 등을 종합적으로 평가할 수 있는 품질기준 및 검증방법을 확립하였다.(붙임 3)
- 아울러 대량의 데이터를 전과정 대부분 수작업으로 구축하여 구축단계에서 완벽한 품질검증이 어려운 구조적 한계를 고려하여, 사후 활용단계에서의 지속적인 유지보수 체계를 마련하기 위해 무상 유지보수기간(1년간)을 설정하고, 기 구축된 데이터(’17~‘19년)에 대해서도 조사를 거쳐 필요시 내년에 유지보수 및 업데이트할 계획이다.
- 또한, 수행기관의 책임감을 제고하기 위해 △데이터별 구축기업 실명제(과제책임자 포함) 도입, △품질평가 결과 공개 및 내년 사업선정 시 반영(가점·감점), △하자 보증금 납부 등의 방안도 마련하였다.
강도현 인공지능기반정책관은 “’품질 자문위‘에 참여하는 각 분야 전문가들의 지혜를 모아서 ’디지털 댐‘의 핵심인 활용도 높은 양질의 인공지능 학습용 데이터 구축에 최선을 다하겠다”고 밝혔다.