SW중심사회

SW소식 이동 SW정책소식 이동

인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진

SW중심사회 과학기술정보통신부 2020-10-07 52명 읽음
디지털 뉴딜, 「데이터 댐」의 핵심 인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진
「데이터 댐」 데이터 품질 개념·범위·세부 요구사항 마련
10월 6일, 정보통신 단체표준화(TTA) 착수, 국제표준안으로도 제안 예정

◆ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고,

 

 ㅇ 한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 10월 6일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식제안하였고, 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망된다.

 

 ㅇ 또한, 앞으로 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다.

 

◆ 이번 표준안에서 인공지능 데이터의 품질을 “인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준”으로 정의하였고,

 

 ㅇ 이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소이다.

 

 ㅇ 하지만, 아직 세계적으로 품질 수준이 높지 않은 상황이다. 예를 들어, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 데이터 정확도가 43~83% 수준에 불과하다.

 

    * '14년 구축 시작된 MS COCO, '16년 구축 시작된 Google Open Images의 현재 라벨링 정확도(재현율-라벨링해야 하는 사물 중 라벨링된 비율)가 83%, 43%에 불과

 

 ㅇ 이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석된다.

 

 ㅇ 특히, 지난 4월 우리나라가 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)*’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안하여 채택되는 등 이제 막 논의가 시작되는 초기단계이다.

    * 국제표준화기구(ISO)와 국제전기기술위원회(IEC)가 정보기술 분야 국제표준화를 위해 운영 중인 합동기술위원회(JTC 1)의 인공지능 분과위원회

 

◆ 이에 한국정보통신기술협회와 한국정보화진흥원을 통해 기 개발된 ‘인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 이번에 표준안을 개발하게 되었다.

 

 ㅇ 표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통적으로 적용 가능한 범용표준의 형태로 개발되었으며,

 

 ㅇ 데이터의 품질을 체계적으로 확보하고 상호호환성을 제고할 수 있도록 데이터 수집‧정제‧가공‧품질검증‧활용 등 전주기 단계별로 필요한 표준절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담고 있다.

 

 ㅇ 구체적으로는 △ 원시데이터 수집단계의 다양성, 사실성 등의 품질 요구사항과 파일 포맷, 해상도 등의 기술 적합성 요구사항, △ 정제단계의 데이터 중복방지 및 비식별화 조치 요구사항, △ 가공단계의 객체 분류체계 및 라벨링 규격 요구사항, △ 품질검수·활용 단계의 유효성 등 검수 요구사항·방법 등으로 구성되어 있다.

 

◆ 과기정통부는 이번에 개발된 표준안을 이미 추경사업 과제(10대 분야, 150종 데이터)에 적용하고 있으며,

 

 ㅇ 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술) 내의 산·학·연 전문가 의견수렴을 거쳐 신속하게 단체 표준화를 추진하고,

 

 ㅇ 앞으로 관련 사항을 국립전파연구원 등을 통해 ‘인공지능 국제표준화회의(ISO/IEC JTC1/SC42)’에 제안하는 등 국제표준화의 성과로 이어지도록 할 계획이다.

 

 ㅇ 아울러, 올 연말까지 표준안을 바탕으로 인공지능 개발자, 공공기관 관계자 등이 인공지능 데이터의 품질을 보다 체계적으로 계획·관리할 수 있도록 하기 위해 자세한 설명 등을 포함하는 ‘인공지능 데이터 품질관리 가이드’를 개발·배포할 계획이다.

 

◆ 과기정통부는 이번에 개발된 표준안이 디지털 뉴딜 ‘데이터 댐’의 핵심자원인 인공지능 데이터의 품질을 향상시키고, 나아가 국가 전반의 인공지능 기술과 서비스의 성능을 높이는데 크게 기여할 것으로 기대하며,

 

 ㅇ 앞으로 국제표준화를 선도하고 우리나라가 인공지능 강국으로 도약하는데 더욱 노력할 계획이다.

홈페이지 만족도

콘텐츠 내용에 만족하십니까? 현재 페이지의 만족도를 평가해 주십시요. 의견을 수렴하여 빠른 시일 내에 반영하겠습니다.

등록