Developers Haven

(DH)블로그는 개발자들이 기술 정보를 찾아볼 수 있는 안식처가 되고 싶음을 희망하여 시작하게 되었습니다. 공부한 내용과 성장 과정을 기록해두었으니 편히 둘러보시길 바랍니다.

Welcome to DH's Blog

[자격증]/DAsP(데이터아키텍처 준전문가)

[DAsP 한 권으로 끝내기] Chapter3.데이터 표준화 - (1)

DH’s Blog 2023. 6. 3. 17:46
반응형

 

데이터 표준화 관련 프로젝트를 진행한 경험이 있는데, 당시 고품질의 데이터 확보와 유지를 위해서 ‘데이터 표준화’의 중요성에 대해 배울 수 있었다. 표준화되지 못한 데이터는 활용상의 어려움이 많았고 타시스템과의 교류에 어려움을 주고 있었다. 이러한 문제점이 표준화를 통해 해결되는 것을 보면서 정보 시스템 구축에 있어 ‘표준화’란 작업이 얼마나 중요한지 깨달을 수 있었다.

 

이번 장에서는 데이터 표준화가 필요한 이유와 표준화 방법에 대해 배울 예정이다. 아래 내용을 보면서 ‘당연한 얘기 아닌가?’하는 생각이 들 수 있지만, 이렇게 당연한 것을 지키는게 생각보다 쉽지 않기 때문에 좀 더 집중해서 봤으면 좋겠다.

 

 

[Part1. 데이터 표준화 필요성]

데이터가 기업의 전략적 의사결정의 핵심 요소가 되고 있지만 데이터 표준 정책을 가지거나 지키는 곳은 많지 않다. 데이터 표준화를 지키지 않으면 어떤 문제가 발생하는 것일까?

 

1-1. 데이터 표준화를 지키지 않을때 발생하는 문제점

  • 조직/업무/시스템별 데이터 명칭 불일치로 데이터 파악을 위해 많은 시간 낭비
  • 전사 단위의 시스템 구축시 데이터 통합의 어려움
  • 데이터 파악이 어렵기 때문에 정보 시스템 변경 및 유지보수의 어려움

 

그럼 이러한 문제점은 어떻게 해결할 수 있고, 해결을 통한 기대효과는 무엇일까?

 

1-2. 데이터 표준화를 실천하기 위한 방법

  • 데이터 표준화, 규격화를 위한 기본 방침을 설정한다.
  • 전사적으로 데이터를 등록하고 관리하는 체계를 구축한다.
  • 정보시스템 개발 및 유지 보수를 위해서 승인된 데이터 요소를 활용한다.

 

1-3. 데이터 표준화를 통한 기대효과

  • 데이터 명칭의 통일을 통한 신속한 의사소통이 가능해진다.
  • 데이터 의미와 위치를 빠르게 파악할 수 있어 정보 제공이 쉬워진다.
  • 표준화를 통해 데이터 입력 오류 방지를 하여 데이터 품질을 향상시킨다.
  • 다른 정보 시스템과의 인터페이스 시 데이터 변환, 정제 비용이 감소한다.

 

 

 

 


[Part2. 데이터 표준화]

위의 내용을 통해 기업의 정보 시스템 구축을 위해서는 데이터 표준화가 왜 필요한지에 대해 알 수 있었다. 그럼 이번에는 데이터 표준화에 대해 더 구체적으로 알아보자.

📌 데이터 표준화란?
- 시스템 내의 데이터에 대한 명칭/정의/형식/규칙에 대한 표준 원칙을 수립하여 전사적으로 적용하는 것을 의미

 

2-1. 데이터 표준화의 원칙

  • 데이터 명칭
    • 해당 개념을 ‘유일’하게 구분해주는 이름을 의미한다.
    • 업무적 관점에서 모두에게 보편적으로 인지되는 이름이어야 한다.
    • 명칭 만으로도 데이터의 의미와 범위가 파악될 수 있어야 한다.

 

  • 데이터 정의
    • 데이터가 의미하는 내용(ex.범위, 자격요건)에 대해 규정한다.
    • 업무를 모르는 제3자의 입장에서 기술하여 누구나 의미를 이해할 수 있도록 한다.
    • 데이터 의미에 대한 정의와 실제 발생하는 값에 대해서도 같이 기술한다.
    • (이해하기 어려운) 약어 또는 전문 용어는 가급적 사용하지 않는다.

 

  • 데이터 형식
    • 데이터의 표현 형식(ex.데이터 타입, 길이, 소수점 자리)을 규정한다.
    • 성격이 유사한 데이터는 데이터 형식을 통일시킨다.
    • 특수 데이터 타입(ex.CLOB, Long Raw)은 데이터 조회, 백업, 이행에서 제약 사항이 많기 때문에 가급적 사용하지 않는다.
    ※ CLOB - 사이즈가 큰 데이터를 외부 파일로 저장하는 데이터 타입

 

  • 데이터 규칙
    • 데이터가 입력되는 규칙을 정의하여 입력 오류를 최소화하며, 기본값/허용값/허용범위로 구성된다.
    • 기본값 - 입력을 생략할 경우 자동으로 입력되는 값
    • 허용값 - 입력이 가능하도록 허용된 값
    • 허용범위 - 입력이 가능한 데이터값의 범위

 

 

2-2. 데이터 표준화 구성요소

📌 전사 데이터 표준을 위해서는 데이터 표준 / 표준화 절차 / 표준 관리 조직 이 필요하다.
  • 데이터 표준
    • 일반적으로 용어/단어/도메인/코드를 표준화한다.
    • 👉 (아래 더보기) 용어/단어/도메인/코드에 대하여
      • 더보기
        1) 표준 용어
             ▪️ 업무적으로 사용하는 용어에 대한 표준으로 업무적, 기술적 용어가 있다.
             ▪️ 업무적 용어 → 보고서 같은 일상 업무에서 사용되는 용어
             ▪️ 기술적 용어 → 데이터베이스와 같은 정보시스템에서 사용되는 용어

        2) 표준 단어
             ▪️ 용어를 구성하는 단어 표준 (단어 + 단어 → 용어)

        3) 표준 도메인
             ▪️ 칼럼에 대한 성질(=도메인)의 표준
             ▪️ 도메인 표준을 통해 칼럼의 데이터 타입 및 길이 등을 일관되게 한다.

        4) 표준 코드
             ▪️ 특정 도메인 값이 미리 정의되어 있는 도메인
             ▪️ 칼럼에 대해 표준 데이터 값을 미리 정의해야 한다.

 

  • 데이터 표준화 절차 (⇒ 다음 장에서 더 자세히!⭐️)
    • 표준화 요구사항 수집 → 표준 정의 → 표준 확정 → 표준 관리
    • 👉 (아래 더보기)  데이터 표준화 절차에 대하여
      • 더보기
        1) 데이터 표준화 요구사항 수집
             ▪️ 개별 시스템의 데이터 표준을 수집하여 표준화 현황을 진단한다.
             ▪️ 데이터 표준화에 대한 요구사항을 수집한다.

        2) 데이터 표준 정의
             ▪️ 표준화 원칙에 따라 표준 용어/단어/도메인/코드를 정의한다.

        3) 데이터 표준 확정
             ▪️ 위에서 정의된 표준에 대해 최종적으로 검토하고 확정한다.

        4) 데이터 표준 관리
             ▪️ 확정된 데이터 표준을 실제로 이행한다.
             ▪️ 데이터 표준 관리 절차를 수립한다. (ex.표준 변경, 준수 검사 절차 등)

 

  • 데이터 표준 관리 조직
    • 데이터 관리자(Data Administrator)는 전사적으로 수립된 데이터 표준 준수 여부를 지속적으로 관리해야 한다.
    • 데이터 관리자의 역할
      1. 데이터에 대한 표준화 원칙 및 표준 정의
      2. 표준에 대한 변경과 추가 발생시 최종 승인을 하는 의사결정자
      3. 데이터 표준 준수 여부를 지속적으로 관리
      4. 데이터에 대한 보안 정책 수립 / 준수 여부 체크 등의 보안 관리
      5. 지속적인 데이터 활용 문제를 체크하며 데이터 활용 방안 수립 및 시행

 

 

 

 

이번 장에서는 데이터 표준화가 무엇인지, 그리고 표준화는 왜 필요한지에 대해서 알아보는 시간이었다. 다음 장에서는 데이터 표준화 절차에 대해서 조금 더 세부적으로 알아보겠다.

 

 

📘참고 서적: [데이터아키텍처 전문가 가이드]
한국데이터산업진흥원 지음

 

 

반응형