과기정통부 바로가기 ICT시험인증연구소 바로가기

1

인증제도

Certificate of Data Quality

인증 소개

DQ인증(데이터 품질인증)이란?

과학기술정보통신부가 지정한 데이터 품질인증기관이 「데이터 산업진흥 및 이용촉진에 관한 기본법」 제20조 5항(데이터 품질인증 대상 및 품질기준)에 의거 ①데이터 내용, ②데이터 관리체계를 진단하고 수준을 평가해 품질을 인증합니다.
  • 관련법령
    「데이터 산업진흥 및 이용촉진에 관한 기본법」 제20조
    「데이터 산업진흥 및 이용촉진에 관한 기본법」 제20조의3부터 제20조의5까지
    「데이터 산업진흥 및 이용촉진에 관한 기본법」 시행규칙 제4조의2, 제4조의3

인증 대상

다양한 산업에서 거래·유통되는 모든 데이터를 대상으로 합니다.

인증 활용방안

데이터 품질인증서는 품질증명, 거래 신뢰성 확보, 내부 품질관리 진단, 마케팅 등 다양한 기대효과를 창출합니다.
  • 정부과제, 프로젝트, 용역 등
    산출물 품질증명
  • 고품질 데이터 확보, 성과지표 활용,
    내부 품질관리 계획 수립
  • 기업 이미지 및 역량
    홍보자료 활용

데이터 내용 인증 체계

■ 데이터 내용 인증 대상

데이터 레코드, 필드에 입력되어 있는 문자, 숫자 등 값과 집합 또는 텍스트, 이미지, 동영상, 음성 등의 원천 데이터와 속성값 등

■ 데이터 내용 인증 유형 및 등급

- 인증 유형

데이터 구조‧관리 특성에 따라 적용 가능한 필수 지표(기본 중요 지표)와 선택 지표(기준 정보에 따른 점검 지표)로 구분 데이터의 복잡도를 고려하여 적용되는 지표에 따라 인증 유형 기준 적용
구분 기준
Complex-Type 필수 심사 항목 전체 적용 및 선택 항목 3개 이상 적용
Normal-Type 필수 심사 항목 전체 적용 및 선택 항목 3개 미만 적용
Simple-Type 필수 심사 항목 일부 적용(불가피하게 데이터 특성에 따라 일부 항목 진행 불가 시)

- 심사지표

데이터의 품질 수준에 따라 3개 등급으로 판정 기준을 구분
구분 판정기준
A Class 데이터 품질 점수(정합율) 0.99 이상 (1-오류/전체 검사)
B Class 데이터 품질 점수(정합율) 0.97 이상 (1-오류/전체 검사)
C Class 데이터 품질 점수(정합율) 0.95 이상 (1-오류/전체 검사)
※ 모든 개별 심사 항목이 0.95 이상

■ 정형데이터 심사

- 정형데이터 심사 대상

정해 놓은 형식과 구조에 따라 저장되도록 구성된 데이터로 테이블과 컬럼으로 구성되어 있음

- 정형데이터 심사 지표

과학기술정보통신부 데이터품질인증 운영 지침을 기준으로 ISO/IEC 25024 평가 항목을 적용하여 정형데이터 자체(inherent) 품질을 판정하기 위한 심사 지표 구성
구분 번호 기준 심사항목 설명 심사 항목 적용
적용기준
필수 1 완전성 데이터값 완전성 데이터 파일의 데이터값에 대한 값의 완전성 데이터 명세 등에 Not null 조건이 있는 경우
2 데이터 파일 레코드 완전성 데이터 파일의 데이터값에 대한 값의 완전성
3 유효성 구문 유효성 구문적으로 정확한 값을 갖는 데이터값의 비율을 측정 구문 정확성이 요구되는 경우 (예: 도메인 규칙, 데이터 타입 등)
4 의미 유효성 의미적으로 정확한 데이터값의 비율을 측정 해당 필드 또는 속성에 의미상으로 유효한 리스트가 존재하는 경우
5 범위 유효성 지정된 범위 안에 포함된 데이터값의 비율을 측정 명세서 등에 범위(숫자)가 정의된 경우 (예: 최대값, 최소값이 적용 가능한 수치)
6 관계 유효성 컬럼 간의 관계규칙이 정의된 데이터 중 관계규칙을 만족하는 데이터의 비율 명세서 등에 의미론적 업무규칙이 정의된 경우 (예: 성별과 주민등록번호의 뒤 첫자리)
7 일관성 참조 무결 일관성 테이블의 한 속성의 다른 테이블에서 같은 속성의 같은 값으로 존재하는 비율을 측정 명세서 등에 테이블간의 참조 무결성이 요구되는 경우
선택 1 유효성 데이터값 정밀성 명세서의 정밀도를 만족하는 데이터값의 비율을 측정 명세서 등에 정밀도가 정의된 경우
※ 반정형의 경우 단위와 자리수를 고려하여 측정(예: 자리수-소수점, 시간 등)
2 일관성 데이터 포맷 일관성 데이터 포맷 일관성이 요구되는 데이터 중 포맷 일관성을 만족하는 데이터 비율 명세서 등에 데이터 포맷이 정의되어 있고, (예: 날짜표시형식) 2개 이상의 유사한 특성 컬럼이 존재해야 함
3 공통 어휘 일관성 데이터 사전에 정의된 공통어휘를 사용하는 데이터 비율 명세서 등에 데이터 사전(공통어휘) 정의된 경우
4 정확성 메타 데이터 정확성 요구사항 명세서에 정의된 메타 데이터 중 적절한 정보는 제공하는 메타 데이터 비율 요구사항 명세서에 메타 데이터에 제공되어야 하는 정보가 기록된 경우
5 데이터값 정확성 데이터 파일 내 데이터값에서 기대 값을 만족하는 데이터값의 비율을 측정 기대되는 데이터값의 값이 정의된 경우(예: 업무규칙 등)
6 접근성 표준기반 데이터 접근성 표준, 협약 또는 규정이 요구되는 데이터 중 해당 표준, 협약 또는 규정에 적합한 데이터 비율 표준, 협약 또는 규정이 존재하는 데이터의 경우
7 유일성 데이터값 유일성 데이터값에 중복이 존재하는 데이터값의 비율을 측정 명세서 내 값의 중복을 허용되지 않는 데이터값이 존재하는 경우

■ 비정형데이터 심사

- 비정형데이터 심사 대상

비정형 데이터 : 비정형데이터는 일반적으로 객체(이미지, 비디오, 사운드, 텍스트) 데이터와 메타데이터(객체 설명 또는 태깅·라벨링 등 작업 내용 설명)로 구성됨
반정형 데이터 : 일부 구조화된 형태를 가지고 있는 데이터로 텍스트 파일, XML, JSON 등의 형식으로 저장되며, 필드와 값의 조합으로 구성됨

- 비정형데이터 심사 지표

과학기술정보통신부 데이터품질인증 운영 지침을 기준으로 ISO/IEC FDIS 5259-2, NIA 학습용 데이터 품질 관리 가이드라인, TTAK.KO-10.1344-Part2 평가 항목을 적용하여 비정형데이터 품질을 판정하기 위한 심사 지표 구성
구분 번호 데이터 품질기준 심사 항목명 설명
필수 1 완전성 데이터파일 레코드 완전성 데이터 파일의 데이터값에 대한 값의 완전성
2 레코드 완전성 데이터 세트에 빈 데이터 아이템이 없는 데이터 레코드의 비율
3 메타 데이터값 완전성 비정형 객체에 대한 메타 데이터 내 필수 항목이 Not Null인 데이터의 비율
4 유효성 데이터 구조 구문 유효성 비정형 객체에 대한 메타데이터나 라벨링 데이터의 구조가 정의된 구조에 적합한 데이터의 비율
5 데이터 포맷 유효성 비정형 객체가 정의된 파일의 포맷에 적합한 데이터 비율
6 파일 유효성 비정형 객체 중 실제 활용할 수 있는 파일의 비율
ㅇ실제 활용이 어려운 예
- 공통 : 파일을 열어 정상적으로 파일이 동작하는지 확인
- 이미지 : 이미지가 깨진 경우
- 텍스트 : 텍스트가 깨져서 내용 확인이 어려운 경우
- 비디오 : 영상이 깨져 내용 확인이 어려운 경우
- 오디오 : 요구 사항에 없는 노이즈 또는 사운드 데이터가 비어 내용 확인이 어려운 경우
7 정확성 구문 정확성 비정형 객체에 대한 메타데이터나 라벨링 데이터 내 속성(컬럼)값이 명세서 기준 구문적으로 정확한 값을 갖는 데이터 아이템의 비율
8 메타 데이터 정확성 비정형 객체의 메타 데이터의 값이 정확한 비율(예: 파일명, 해상도, 확장자 등)
9 유일성 객체 유일성 동일한 객체 데이터가 존재하는 비율(파일명이 아닌 데이터의 내용의 동일성 측정)
선택 10 완전성 어노테이션 완전성 학습용 데이터의 경우, 객체 데이터에 라벨이 존재하는 비율
(학습용 데이터의 경우 필수 항목으로 적용)
ㅇ 유형별 어노테이션 예
- 텍스트 : 내용 요약, 변역, 질의응답, 말뭉치 태깅 등
- 이미지/비디오 : 라벨링, 바운딩박스, 키포인트, 세그멘테이션, 태깅 등
- 오디오 : 전사 등
11 특징 완전성 데이터 세트의 지정(요구)된 특징에 대하여 null 데이터값이 없는 데이터 아이템의 비율
12 유효성 관계 유효성 비정형 객체의 속성과 메타데이터/어노테이션 데이터의 속성들 간의 규칙이 존재하는 경우, 규칙에 맞는 데이터 아이템의 비율
13 데이터값 정밀성 데이터 명세서에 요구되는 정밀도 만족하는 데이터값의 비율
14 데이터 속성 유효성 비정형 객체 데이터의 속성이 기준에 적합한 비율
ㅇ 유형별 속성 예
- 이미지 : 밝기, 해상도, 컬러심도, 픽셀당 비트수 등
- 동영상 : 해상도, 컬러심도, 프레임레이트, 재생시간 등
- 오디오 : 주파수, 재생시간, 평균 데시벨 등
- 텍스트 : 어절수, 어휘 개수, 문장의 길이 등급
15 범위 유효성 메타데이터 또는 어노테이션 데이터의 속성 값이 요구되는 범위 안에 포함되는 비율
16 시간 유효성 비정형 객체 데이터의 생성 또는 수집 시간이 기준 시간을 만족하는 비율
17 어노테이선 유효성 학습용 데이터의 경우, 어노테이션 데이터의 어노테이션 값이 기준을 만족하는 비율(예: 바운딩박스 크기, 정해진 카테고리 또는 라벨링 기준 등)
18 일관성 공통 어휘 일관성 데이터 사전에 정의된 용어(terms)로 사용되는 공통 인식 어휘 비율
19 데이터 포맷 일관성 동일한 데이터 아이템의 데이터 포맷을 준수하는 데이터 아이템 비율
20 정확성 어노테이션 정확성 학습 데이터의 경우, 어노테이션 데이터가 정확한 비율
ㅇ 유형별 어노테이션 예
- 텍스트 : 내용 요약, 변역, 질의응답, 말뭉치 태깅 등
- 이미지/비디오 : 라벨링, 바운딩박스, 키포인트, 세그멘테이션, 태깅 등
- 오디오 : 전사 등
21 주제 정확성 비정형 객체가 주어진 주제(컨텍스트)를 반영하는 비율
22 접근성 데이터 포맷 접근성 일반적인 데이터 포맷으로 의도된 사용자가 데이터나 정보에 접근할 수 비율 (예 : 이미지의 경우 jpg, png, bmp 등)
23 표준기반 데이터 접근성 표준, 협약 또는 규정에 부합해야 하는 전체 데이터 아이템의 비율
24 유일성 레코드 유일성 데이터 세트의 중복 레코드 비율

데이터 관리체계의 인증 체계

■ 데이터 관리체계 인증 대상

데이터 관리 원칙을 정의하고, 데이터 표준, 데이터 품질, 데이터 구조, 데이터 연계 등에 대한 업무 기능, 조직, 프로세스, 제도 등을 체계적으로 정립하여 실행하는 것

■ 데이터 관리체계 인증 등급

ISO/IEC 33020를 기반으로 성숙도 수준은 총 5개로 구분하고, Level 2(관리 수준)부터 데이터 품질 관리체계 인증 부여
인증 등급 성숙도 수준 특징
인증하지 않음 1 도입 데이터 품질 인식은 존재하지만 체계적인 관리 활동 미흡
Level 2 2 관리 기본적인 관리 활동 존재(성과 관리 및 산출물 관리)
Level 3 3 체계화 공식화된 관리 활동이 체계적으로 수행
Level 4 4 예측화 계량적이고 통계적인 방법으로 성과를 안정적으로 유지
Level 5 5 혁신화 데이터 품질 관리체계를 지속적으로 고도화

- 심사 대상 : ISO/IEC 8000-61을 준용하여 능력 수준별 데이터 품질관리 프로세스

능력 수준 프로세스 속성
0 불완전 적용 불가
1 수행 PA 1.1 프로세스 수행 프로세스가 정의된 프로세스 결과를 달성
2 관리 PA 2.1 성과 관리 프로세스 수행이 관리되는 정도를 측정하는 속성
PA 2.2 작업 산출물 관리 작업 산출물이 적절히 관리되는 정도를 측정하는 속성
3 체계화 PA 3.1 프로세스 정의 표준 프로세스가 정의된 프로세스의 전개를 지원할 수 있도록 유지관리되는 정도를 측정하는 속성
PA 3.2 프로세스 전개 표준 프로세스가 프로세스 산출물을 달성할 수 있도록 정의된 프로세스와 같이 전개되는 정도를 측정하는 속성
4 예측화 PA 4.1 정량적 분석 정보 필요가 정의되고, 프로세스 요소 간 관련성이 식별되고, 데이터가 수집되는 정도를 측정하는 속성
PA 4.2 정량적 통제 프로세스 성과가 예측 가능하도록 관리하기 위해 객관적 데이터가 사용되는 정도를 측정하는 속성
5 혁신화 PA 5.1 프로세스 혁신 프로세스의 정의 및 전개를 위한 혁신적인 방법에 대한 탐구를 통해 프로세스의 변경이 식별된 정도를 측정하기 위한 속성
PA 5.2 프로세스 혁신 구현 관련성 있는 프로세스 혁신 목적을 달성하는 프로세스의 정의, 관리 및 수행에 대한 변화의 정도를 측정하기 위한 속성

- 심사 방법 : ISO/IEC 33020을 준용한 프로세스 능력(capability)은 5개 성숙도별 요구사항의 적합 여부 심사

성숙도 수준 내용 설명
1 도입 운영 프로세스가 요구사항을 충족하는 데이터를 접근할 수 있음을 입증할 수 있다. 이러한 데이터에는 적절한 보안 고려사항이 적용된다. 요구사항 관리 및 데이터 처리 활동에 대한 증빙 자료를 제공하지 않는다.
2 관리 요구사항을 관리하고 데이터 처리 수행 방법을 관리하게끔 운영 프로세스가 데이터를 사용한다는 것을 입증할 수 있다. 데이터가 요구사항을 충족하는 증빙 자료를 제공할 수 있다.
3 체계화 운영 프로세스가 조직이 데이터 품질관리를 수행하기 위해 공통적이고 반복 가능한 프로세스를 구현한 데이터를 사용한다는 것을 입증할 수 있다.
4 예측화 운영 프로세스가 데이터 품질관리를 수행하기 위해 예측 가능한 프로세스를 구현한 데이터를 사용한다는 것을 입증할 수 있다. 예측 가능성에는 데이터 품질관리 성과 측정을 수반한다.
5 혁신화 운영 프로세스가 조직의 목표를 달성하는 데 지속 가능한 데이터 품질관리를 수행하기 위한 프로세스를 구현한 데이터를 사용한다는 것을 입증할 수 있다. 이러한 지속 가능성에는 적절한 혁신이 적용된다.

- 성숙도 수준별 심사 범위(요구사항)

성숙도 수준 심사 대상 프로세스 요구되는 프로세스 속성
1 도입 DQC.2 데이터 처리 DRS.4 데이터 보안 관리 PA 1.1 프로세스 수행
2 관리 DQC.2 데이터 처리
DRS.4 데이터 보안 관리
DQP.1 요구사항 관리
DQC.1 데이터 명세 및 작업지시서 제공
DQC.3 데이터 품질 모니터링 및 통제
PA 1.1 프로세스 수행
PA 2.1 성과 관리
PA 2.2 작업 산출물 관리
3 체계화 DQC.2 데이터 처리
DRS.4 데이터 보안 관리
DQP.1 요구사항 관리
DQC.1 데이터 명세 및 작업지시서 제공
DQC.3 데이터 품질 모니터링 및 통제
DQP.2 데이터 품질 전략 관리
DQP.3 데이터 품질 정책/표준/절차 관리
DQP.4 데이터 품질 실행 계획
DRS.1 데이터 아키텍처 관리
DRS.3 데이터 운용 관리
RPV.1 데이터 품질 조직 관리
DQI.2 데이터 클렌징
PA 1.1 프로세스 수행
PA 2.1 성과 관리
PA 2.2 작업 산출물 관리
PA 3.1 프로세스 정의
PA 3.2 프로세스 전개
4 예측화 DQC.2 데이터 처리
DRS.4 데이터 보안 관리
DQP.1 요구사항 관리
DQC.1 데이터 명세 및 작업지시서 제공
DQC.3 데이터 품질 모니터링 및 통제
DQP.2 데이터 품질 전략 관리
DQP.3 데이터 품질 정책/표준/절차 관리
DQP.4 데이터 품질 실행 계획
DRS.1 데이터 아키텍처 관리
DRS.3 데이터 운용 관리
RPV.1 데이터 품질 조직 관리
DQI.2 데이터 클렌징
DQA.1 데이터 품질 이슈 점검
DQA.2 측정 기준 제공
DQA.3 데이터 품질 프로세스 성과 측정
DQA.4 측정 결과 평가
DRS.2 데이터 흐름 관리
RPV.2 인적 자원 관리
PA 1.1 프로세스 수행
PA 2.1 성과 관리
PA 2.2 작업 산출물 관리
PA 3.1 프로세스 정의
PA 3.2 프로세스 전개
PA 4.1 정량적 분석
PA 4.2 정량적 통제
5 혁신화 DQC.2 데이터 처리
DRS.4 데이터 보안 관리
DQP.1 요구사항 관리
DQC.1 데이터 명세 및 작업지시서 제공
DQC.3 데이터 품질 모니터링 및 통제
DQP.2 데이터 품질 전략 관리
DQP.3 데이터 품질 정책/표준/절차 관리
DQP.4 데이터 품질 실행 계획
DRS.1 데이터 아키텍처 관리
DRS.3 데이터 운용 관리
RPV.1 데이터 품질 조직 관리
DQI.2 데이터 클렌징
DQA.1 데이터 품질 이슈 점검
DQA.2 측정 기준 제공
DQA.3 데이터 품질 프로세스 성과 측정
DQA.4 측정 결과 평가
DRS.2 데이터 흐름 관리
RPV.2 인적 자원 관리
DQI.1 근본 원인 분석 및 해결 방안 개발
DQI.3 데이터 오류 방지 위한 프로세스 개선
PA 1.1 프로세스 수행
PA 2.1 성과 관리
PA 2.2 작업 산출물 관리
PA 3.1 프로세스 정의
PA 3.2 프로세스 전개
PA 4.1 정량적 분석
PA 4.2 정량적 통제
PA 5.1 프로세스 혁신
PA 5.2 프로세스 혁신 구현

문의 및 상담

  • 담당부서 : 데이터인증센터(DCC) 인증운영팀
    담당자 : 김수태 팀장 ㅣ  연락처 : 02-2039-3155  ㅣ  이메일 : data@tecel.kr
고객의소리