데이터 표준화 관련 프로젝트를 진행한 경험이 있는데, 당시 고품질의 데이터 확보와 유지를 위해서 ‘데이터 표준화’의 중요성에 대해 배울 수 있었다. 표준화되지 못한 데이터는 활용상의 어려움이 많았고 타시스템과의 교류에 어려움을 주고 있었다. 이러한 문제점이 표준화를 통해 해결되는 것을 보면서 정보 시스템 구축에 있어 ‘표준화’란 작업이 얼마나 중요한지 깨달을 수 있었다.
이번 장에서는 데이터 표준화가 필요한 이유와 표준화 방법에 대해 배울 예정이다. 아래 내용을 보면서 ‘당연한 얘기 아닌가?’하는 생각이 들 수 있지만, 이렇게 당연한 것을 지키는게 생각보다 쉽지 않기 때문에 좀 더 집중해서 봤으면 좋겠다.
[Part1. 데이터 표준화 필요성]
데이터가 기업의 전략적 의사결정의 핵심 요소가 되고 있지만 데이터 표준 정책을 가지거나 지키는 곳은 많지 않다. 데이터 표준화를 지키지 않으면 어떤 문제가 발생하는 것일까?
1-1. 데이터 표준화를 지키지 않을때 발생하는 문제점
- 조직/업무/시스템별 데이터 명칭 불일치로 데이터 파악을 위해 많은 시간 낭비
- 전사 단위의 시스템 구축시 데이터 통합의 어려움
- 데이터 파악이 어렵기 때문에 정보 시스템 변경 및 유지보수의 어려움
그럼 이러한 문제점은 어떻게 해결할 수 있고, 해결을 통한 기대효과는 무엇일까?
1-2. 데이터 표준화를 실천하기 위한 방법
- 데이터 표준화, 규격화를 위한 기본 방침을 설정한다.
- 전사적으로 데이터를 등록하고 관리하는 체계를 구축한다.
- 정보시스템 개발 및 유지 보수를 위해서 승인된 데이터 요소를 활용한다.
1-3. 데이터 표준화를 통한 기대효과
- 데이터 명칭의 통일을 통한 신속한 의사소통이 가능해진다.
- 데이터 의미와 위치를 빠르게 파악할 수 있어 정보 제공이 쉬워진다.
- 표준화를 통해 데이터 입력 오류 방지를 하여 데이터 품질을 향상시킨다.
- 다른 정보 시스템과의 인터페이스 시 데이터 변환, 정제 비용이 감소한다.
[Part2. 데이터 표준화]
위의 내용을 통해 기업의 정보 시스템 구축을 위해서는 데이터 표준화가 왜 필요한지에 대해 알 수 있었다. 그럼 이번에는 데이터 표준화에 대해 더 구체적으로 알아보자.
📌 데이터 표준화란?
- 시스템 내의 데이터에 대한 명칭/정의/형식/규칙에 대한 표준 원칙을 수립하여 전사적으로 적용하는 것을 의미
2-1. 데이터 표준화의 원칙
- 데이터 명칭
- 해당 개념을 ‘유일’하게 구분해주는 이름을 의미한다.
- 업무적 관점에서 모두에게 보편적으로 인지되는 이름이어야 한다.
- 명칭 만으로도 데이터의 의미와 범위가 파악될 수 있어야 한다.
- 데이터 정의
- 데이터가 의미하는 내용(ex.범위, 자격요건)에 대해 규정한다.
- 업무를 모르는 제3자의 입장에서 기술하여 누구나 의미를 이해할 수 있도록 한다.
- 데이터 의미에 대한 정의와 실제 발생하는 값에 대해서도 같이 기술한다.
- (이해하기 어려운) 약어 또는 전문 용어는 가급적 사용하지 않는다.
- 데이터 형식
- 데이터의 표현 형식(ex.데이터 타입, 길이, 소수점 자리)을 규정한다.
- 성격이 유사한 데이터는 데이터 형식을 통일시킨다.
- 특수 데이터 타입(ex.CLOB, Long Raw)은 데이터 조회, 백업, 이행에서 제약 사항이 많기 때문에 가급적 사용하지 않는다.
- 데이터 규칙
- 데이터가 입력되는 규칙을 정의하여 입력 오류를 최소화하며, 기본값/허용값/허용범위로 구성된다.
- 기본값 - 입력을 생략할 경우 자동으로 입력되는 값
- 허용값 - 입력이 가능하도록 허용된 값
- 허용범위 - 입력이 가능한 데이터값의 범위
2-2. 데이터 표준화 구성요소
📌 전사 데이터 표준을 위해서는 데이터 표준 / 표준화 절차 / 표준 관리 조직 이 필요하다.
- 데이터 표준
- 일반적으로 용어/단어/도메인/코드를 표준화한다.
- 👉 (아래 더보기) 용어/단어/도메인/코드에 대하여
-
더보기1) 표준 용어
▪️ 업무적으로 사용하는 용어에 대한 표준으로 업무적, 기술적 용어가 있다.
▪️ 업무적 용어 → 보고서 같은 일상 업무에서 사용되는 용어
▪️ 기술적 용어 → 데이터베이스와 같은 정보시스템에서 사용되는 용어
2) 표준 단어
▪️ 용어를 구성하는 단어 표준 (단어 + 단어 → 용어)
3) 표준 도메인
▪️ 칼럼에 대한 성질(=도메인)의 표준
▪️ 도메인 표준을 통해 칼럼의 데이터 타입 및 길이 등을 일관되게 한다.
4) 표준 코드
▪️ 특정 도메인 값이 미리 정의되어 있는 도메인
▪️ 칼럼에 대해 표준 데이터 값을 미리 정의해야 한다.
-
- 데이터 표준화 절차 (⇒ 다음 장에서 더 자세히!⭐️)
- 표준화 요구사항 수집 → 표준 정의 → 표준 확정 → 표준 관리
- 👉 (아래 더보기) 데이터 표준화 절차에 대하여
-
더보기1) 데이터 표준화 요구사항 수집
▪️ 개별 시스템의 데이터 표준을 수집하여 표준화 현황을 진단한다.
▪️ 데이터 표준화에 대한 요구사항을 수집한다.
2) 데이터 표준 정의
▪️ 표준화 원칙에 따라 표준 용어/단어/도메인/코드를 정의한다.
3) 데이터 표준 확정
▪️ 위에서 정의된 표준에 대해 최종적으로 검토하고 확정한다.
4) 데이터 표준 관리
▪️ 확정된 데이터 표준을 실제로 이행한다.
▪️ 데이터 표준 관리 절차를 수립한다. (ex.표준 변경, 준수 검사 절차 등)
-
- 데이터 표준 관리 조직
- 데이터 관리자(Data Administrator)는 전사적으로 수립된 데이터 표준 준수 여부를 지속적으로 관리해야 한다.
- 데이터 관리자의 역할
- 데이터에 대한 표준화 원칙 및 표준 정의
- 표준에 대한 변경과 추가 발생시 최종 승인을 하는 의사결정자
- 데이터 표준 준수 여부를 지속적으로 관리
- 데이터에 대한 보안 정책 수립 / 준수 여부 체크 등의 보안 관리
- 지속적인 데이터 활용 문제를 체크하며 데이터 활용 방안 수립 및 시행
이번 장에서는 데이터 표준화가 무엇인지, 그리고 표준화는 왜 필요한지에 대해서 알아보는 시간이었다. 다음 장에서는 데이터 표준화 절차에 대해서 조금 더 세부적으로 알아보겠다.
📘참고 서적: [데이터아키텍처 전문가 가이드]
한국데이터산업진흥원 지음
'[자격증] > DAsP(데이터아키텍처 준전문가)' 카테고리의 다른 글
[DAsP 한 권으로 끝내기] Chapter4.데이터 모델링 - (1) (0) | 2023.06.03 |
---|---|
[DAsP 한 권으로 끝내기] Chapter3.데이터 표준화 - (2) (0) | 2023.06.03 |
[DAsP 한 권으로 끝내기] Chapter2.데이터 요건 분석 - 추가자료 (2) | 2023.06.03 |
[DAsP 한 권으로 끝내기] Chapter2.데이터 요건 분석 - (2) (2) | 2023.06.03 |
[DAsP 한 권으로 끝내기] Chapter2.데이터 요건 분석 - (1) (2) | 2023.06.03 |