Developers Haven

(DH)블로그는 개발자들이 기술 정보를 찾아볼 수 있는 안식처가 되고 싶음을 희망하여 시작하게 되었습니다. 공부한 내용과 성장 과정을 기록해두었으니 편히 둘러보시길 바랍니다.

Welcome to DH's Blog

[자격증]/DAsP(데이터아키텍처 준전문가)

[DAsP 한 권으로 끝내기] Chapter3.데이터 표준화 - (2)

DH’s Blog 2023. 6. 3. 18:03
반응형

 

 

지난장에서는 표준화의 개념과 정보 시스템에서 표준화가 필요한 이유에 대해서 알아보았다. 이번장에서는 표준화 관련 절차에 대해서 조금 더 세부적으로 알아보도록 하자.

 

 

📌 [데이터 표준화 절차]
: 표준화 요구사항 수집 → 표준 정의 → 표준 확정 → 표준 관리

 

[Part1. 데이터 표준화 원칙 정의]

1-1. 데이터 표준화 요구사항 수집

  • 인터뷰 및 설문 조사를 통해 현업 및 개발자로부터 데이터 표준에 대한 요구사항을 수집한다.
  • 요구사항 수집 시에는 제3자의 관점이나 해당 업무 영역에 익숙지 않은 관련자의 관점이 더 유용하다 → 본인 업무에 익숙한 담당자는 표준화의 필요성을 많이 느끼지 못할 수 있으므로

 

1-2. 현행 데이터 표준 원칙 분석

  • 현행 정보시스템에서의 데이터 표준 원칙을 수집하여 데이터 표준 관리 대상과 현황을 파악한다.
  • 현행 정보시스템의 개발 지침 문서와 데이터 모델을 통해 데이터 표준 원칙 내용을 수집한다.

 

1-3. 데이터 표준 개선 방안 정의

  • 위에서 분석한 결과를 바탕으로 데이터 표준 대상별 문제점과 개선 방안을 도출한다.
  • 이때, 기존에 수립된 데이터 관리 정책을 따르는 개선 방안을 정의해야 한다.

 

1-4. 데이터 표준 원칙 수립

  • 향후 적용할 전사 데이터 표준 기본 원칙을 정의하고 문서화한다.
  • 표준화 문서의 구성 예시
    • 데이터 표준에 대한 목적
    • 표준화 관련자들(ex.데이터 관리자, 모델러)의 역할과 책임 규정
    • 데이터 표준 관리 절차 정의 
    • 데이터 표준 기본 원칙 및 명명 규칙 정의 
    • 데이터 형식에 대한 기준 정의

 

  • 표준화 원칙의 예시
    • 회사에서 사용되는 관용 용어를 우선적으로 사용한다. 
    • 영문명 전환 시, 발음식 단어는 최대한 지양하도록 한다. 
    • 한글명, 영문명 부여 시 특수문자와 띄어쓰기는 사용하지 않는다. 
    • 기관명은 해당 기관에서 사용하는 약어(영문)을 따르도록 한다. 
    • 한글명에 대해서는 복수의 영문명을 허용하지 않는다. (=동음이의어 불가)
    • 영문명에 대해서는 복수의 한글명을 허용한다. (=이음동의어 허용)

 

1-5. 데이터 표준 검토 및 확정

  • 먼저 정의된 표준 단어/도메인/코드/용어 사전에 대해 최종적으로 검토한다.
  • 검토 과정에서 발견된 보완사항을 토대로 수정하며, 최종적으로 보완사항이 모두 반영되었는지 검토하고 승인한다. (⇒ 데이터 표준 확정)
  • 마지막으로 확정된 데이터 표준을 전사 시스템에 적용하고, 사용자 및 운영자에게 표준화 관련 교육을 실시하도록 한다.
  • 표준 검토 방법
    • 표준 대상별 필수 입력 사항들이 모두 정의되었는지 확인한다.
    • 정의된 데이터 표준이 여러 정보시스템에서 적용 가능한지 확인하고, 향후 사용될 검토 계획을 수립한다.

 

 

 


[Part2. 데이터 표준 정의]

데이터 표준화는 일반적으로 위의 단계를 통해 진행되며, 현행 시스템에 맞는 표준화 방법으로 진행해야 한다. 지금부터는 실제 표준화 원칙이 정의되는 [단어/용어/도메인/코드]가 무엇인지에 대해 알아보도록 하자.

 

2-1. 표준 단어

  • 표준 단어란?
    • 우선, 단어는 문법상의 의미를 가지는 ‘말의 최소 단위’를 의미한다.
    • 이러한 최소 단위를 가지는 단어에 대한 표준을 사전으로 정의한 것이 ‘표준 단어 사전’이다.

 

  • 표준 단어 사전은 어떻게 정의할까?
    • 가장 먼저 기존 데이터 모델과 용어 지침 등을 통해 사용되는 모든 용어를 단어 단위로 분할하여 추출한다.
    • 추출된 단어를 종류와 유형별로 분류하고, 업무적 용도에 따라서 표준 단어를 정의하게 된다.

 

  • 표준 단어 정의 시 고려사항
    • 일반적인 업무에서 사용되는 단어를 추출해야 하며, 특정 업무에서만 사용되는 용어는 지양해야 한다.
    • 누구나 단어의 의미를 동일하게 이해할 수 있는 일반적인 단어로 선정해야 한다.
    • 비슷한 의미의 동의어에 대해 대표할 수 있는 단어로 선정해야 한다.
    • 접두어, 접미어와 같이 한 자리로 구성된 단어는 가급적 표준에서 배제한다.
    • 만약 특정 단어의 조합의 사용 빈도가 높은 경우, 해당 단어의 조합을 하나의 표준 단어로 정의할 수도 있다. (ex.신용(단어) + 카드(단어) → 신용카드(하나의 표준단어))

 

 

2-2. 표준 도메인

  • 도메인이란?
    • 속성(=컬럼)에 정의된 조건을 만족시키는 값의 범위를 의미한다.
    • 기본적으로 코드성/숫자/날짜/문자 도메인으로 구성되어 있다.

 

  • 표준 도메인 사전은 어떻게 정의할까?
    • 먼저 정보시스템에 대한 데이터 모델 및 칼럼 정의서를 이용하여 현행 용어에 대한 데이터 타입 정보를 수집하고, 유사한 용어들을 그룹화한다.
    • 해당 그룹에 속하는 데이터의 유형과 길이를 표준 도메인으로 정의하게 된다.
    • 쉽게 생각하면 정보시스템의 칼럼명/데이터타입/길이에 대한 표준을 정의한다고 보면 된다.

 

  • 표준 도메인 정의 시 고려사항
    • 전사 차원에서 공통적으로 사용되는 속성을 도메인 정의 대상으로 선정한다.
    • 각 업무의 특성을 충분히 반영할 수 있도록 표준 도메인을 정의해야 한다.

 

 

2-3. 표준 코드

  • 표준 코드 사전은 어떻게 정의할까?
    • 수집된 용어 중에서 코드만을 선별하여 해당 코드 값들을 조사한다.
    • 조사된 대상에서 코드 통합 대상을 파악하고 단일화 작업을 거쳐 표준 코드를 정의한다.

 

  • 표준 코드 정의 시 고려사항
    • 표준화 기구,정부 등에서 정의한 표준 코드를 사용하는 것이 코드 관리에 더 효과적이다.
    • 가능한 범위의 데이터는 모두 코드화하여 정의된 범위 안에서 값을 선택하도록 하고, 사용자가 텍스트로 직접 데이터를 입력하는 것을 최소화해야한다.
    • 표준 코드는 엄격한 기준을 가지고 관리되어야 하며, 사용자가 임의로 코드 체계를 생성하거나 수정해서는 안된다.
    • 시스템 운영 중에 코드 값이 변경되는 경우 사용 중지 상태로 관리하고 새로운 코드 값을 신규로 정의한다.
    • 표준 코드-현행 코드의 변환 매핑 정보를 기록하여 신규 정보시스템으로의 데이터 이행 업무에 참고하도록 한다.

 

  • 표준 코드의 예시
    • A, B 부서에서 서로 다르게 정의된 코드를 ‘표준 코드’ 기준으로 새롭게 정의해준다.

 

 

 

2-4. 표준 용어

  • 용어란?
    • 단어의 조합을 용어로 정의한다. (단어 + 단어 → 용어)

 

  • 표준 용어 사전은 어떻게 정의할까?
    • 먼저 정보시스템별로 사용되고 있는 모든 현행 용어를 수집한다.
    • 전사적으로 적용된 표준 단어/도메인/코드 사전을 참조하여 표준 용어 사전을 정의한다.
    • 표준 용어를 정의함으로써 서로 다른 업무 간에 의사소통을 원활하게 만들어준다.

 

  • 표준 용어 정의 시 고려사항
    • 용어의 표준화를 통해 용어에 대한 전사 차원의 혼란을 최소화할 수 있어야 한다.
    • 업무 범위 내에서 약어를 용어로 사용할 수는 있지만, 지나친 약어 사용은 피해야 한다.

 

 

 

 


[Part3. 데이터 표준 관리]

‘그럼 이렇게 표준화를 만들고 나면 끝나는 것일까?’

 

답은 ‘No’이다. 표준화 작업이 끝나더라도 계속적으로 표준화가 잘 관리될 수 있도록 노력하는 것이 필요하다. 데이터 표준이 잘 관리되기 위해서는 담당자별 역할과 업무가 명확하게 정의되어 있어야 하며, 각 역할은 아래와 같다.

 

  • 담당자별 표준 관리 업무 역할
역할 담당 업무
업무 담당자 * 표준 단어/용어/도메인/코드 신규 생성 및 변경 요청
데이터 관리자 * 업무 담당자로부터 요청받은 신규 및 변경 사항 검토 및 표준 준수 여부 체크
* 변경 영향도 분석 및 변경 계획 수립
* 메타 DB에 표준 등록 후 표준 재배포
데이터베이스 관리자 * 변경된 표준 사항에 대한 영향도 파악 및 평가서 작성
* 테스트 및 검증
* 사용자 반영 결과 통보
전사 데이터 관리자 * 전사 관점에서의 표준 가이드 자문 및 제시

 

 

 

 

 

이번 내용은 표준 단어/용어/도메인/코드 정의를 하는 방법과 각 표준 사전 정의 시 고려해야할 부분에 대해서 배워보았다. 신규 정보 시스템을 구축하거나 기존 시스템을 변경하기 위해서는 위와 같은 표준화 내용을 기반으로 진행되어야 하며, 여기서 배운 내용을 잘 적응하면 좋겠다. 다음장에서는 최종적으로 데이터 모델링을 하는 방법에 대해서 알아볼 예정이다.

 

📘참고 서적: [데이터아키텍처 전문가 가이드]
한국데이터산업진흥원 지음

 

 

 

반응형