티스토리 뷰

데이터 모델링의 이해

 

데이터 모델링의 특징

  1. 추상화(Abstraction) : 현실 세계를 일정한 양식(표기법)에 맞게 간략하게 표현
  2. 단순화(Simplification) : 누구나 이해하기 쉽도록 약속된 규약에 의한 제한된 표기법 또는 언어를 이용하여 표현
  3. 명확화(Clarity) : 명확하게 한 가지로 해석되며 정확하게 현상을 기술

 

데이터 모델링의 단계

  1. 개념적 모델링
    • 추상화 수준이 가장 높음
    • 업무 측면의 모델링
    • 전사적이고 포괄적인 모델링
    • 핵심 엔티티 도출, ERD 작성
  2. 논리적 모델링
    • 특정 데이터베이스 모델에 종속
    • 재사용성 높음
    • 세부속성, 식별자, 관계 등을 표현
    • 데이터 정규화 완료
  3. 물리적 모델링
    • 물리적인 성능과 데이터 저장을 고려한 설계
    • 가장 구체적인 데이터 모델링
    • 성능, 보안, 가용성을 고려

 

데이터 모델링의 3가지 관점

  1. 데이터 관점
    • 데이터와 업무 간 어떤 관련? 데이터와 데이터 사이의 관계가 무엇인지에 따른 모델링
    • 비즈니스 프로세스에서 사용되는 데이터
    • 구조분석, 정적분석
  2. 프로세스 관점
    • 실제 하는 업무에 따라 무엇을 어떻게 하는지 모델링
    • 비즈니스 프로세스에서 수행하는 작업
    • 시나리오 분석, 도메인 분석, 동적 분석
  3. 데이터와 프로세스의 상관 관점
    • 업무의 처리(프로세스)와 데이터 간의 영향 모델링
    • 프로세스와 데이터 간의 관계
    • CRUD

 

데이터 모델링을 위한 ERD(Entity Relationship Diagram)

  • 대표적인 표기법 : IE/Crow's Foot, Barker
  • ERD 작성 순서
    • 엔티티 도출
    • 엔티티 배치
    • 엔티티 관계 설정
    • 관계명 기술
    • 관계 참여도 기술
    • 관계 필수 여부 기술

 

3단계 구조 스키마

  • 각 계층을 뷰라고 부르며 3단계 계층으로 분리되어 데이터베이스의 독립성을 확보
  • 사용자(외부 스키마), 설계자(내부 스키마), 개발자(개념 스키마)의 관점

 

3단계 구조 특징

  1. 외부 스키마
    • 데이터베이스 개별 사용자 관점
    • 응용 프로그램이 접근하는 데이터베이스
    • 여러 개의 외부 스키마가 존재
  2. 개념 스키마
    • 데이터베이스 관리자의 관점으로 규칙과 구조 표현
    • 데이터베이스 전제적인 논리 구조
    • 일반적인 스키마 지칭
  3. 내부 스키마
    • 데이터베이스 시스템의 설계자 관점으로 저장 장치 관점의 이해와 표현
    • 데이터가 실제로 데이터베이스에 물리적으로 어떻게 저장되는지 확인

 

엔터티

  • 저장되며 관리되는 데이터의 집합
  • 개념, 사건, 장소 등의 명사

 

유형과 무형에 따른 분류

  1. 유형 엔터티
    • 물리적이고 안정적이며 지속적인 엔터티
    • 사원, 제품, 교수 등
  2. 개념 엔터티
    • 개념적으로 존재하며 정보고 구분되는 엔터티
    • 강의, 금융상품, 부서 등
  3. 사건 엔터티
    • 비즈니스 프로세스에 따라 발생하는 엔터티로 데이터가 많음
    • 구매, 판매, 영업, 수납 등

 

발생 시점에 따른 분류

  1. 기본 엔터티(키 엔터티)
    • 독립적으로 생성 및 관리
    • 고객, 부서, 제품
  2. 중심 엔터티
    • 기본 엔터티로부터 발행되는 행위 엔터티를 생성하는 중간 엔터티
    • 계좌, 주문, 수납
  3. 행위 엔터티
    • 상위에 있는 2개 이상의 엔터티로부터 발생되는 엔터티
    • 주문 이력, 접속 이력

 

속성

  • 엔터티가 가지는 항목
  • 더이상 분리되지 않음
  • 업무에 필요한 데이터를 저장
  • 인스턴스의 구성 요소로 최소의 데이터 단위

 

속성의 특징

  • 속성은 업무에서 관리되는 정보
  • 하나의 값만을 가짐
  • 주식별자에게 함수적으로 종속됨
  • 기본키에 따라 속성의 값도 변경될 수 있음

 

속성의 종류

  1. 기본 속성
    • 비즈니스 프로세스에서 도출한 본래의 속성
    • 이름, ID, 전화번호
  2. 설계 속성
    • 데이터 모델링 과정에서 발생되는 속성
    • 상품코드, 지점코드
  3. 파생 속성
    • 다른 속성에 의해서 만들어지는 속성
    • 합계, 평균

 

 

데이터 모델과 성능

 

성능 데이터모델링

  • 데이터베이스 성능 향상이 목적
  • 설계단계부터 성능과 관련된 사항을 모델링에 반영
  • 데이터모델은 성능을 튜닝하면서 변경이 될 수 있음
  • 성능저하에 따른 비용을 최소화

 

모델링의 순서

  • 정규화
  • 용량 산정
  • 트랜잭션 유형 파악
  • 반정규화
  • 조정(이력모델, PK/FK, 슈퍼/서브타입)
  • 데이터 모델 검증

 

대량 데이터 발생에 따른 형태

  • 로우체이닝(Row Chaining) : 로우 길이가 너무 길어서 두 개 이상의 블록에 하나의 로우가 저장되어 있는 형태
  • 로우마이그레이션(Row Migration) : 데이터 블록속에서 수정이 발생하면 수정된 데이터를 해당 데이터 블록에서 저장하지 못하고 다른 블록의 빈 공간을 찾아 저장하는 방식

 

칼럼 수가 적지만 데이터 용량이 많아 성능저하가 예상되는 경우 파티셔닝 전략 고려

 

정규화

  1. 제1정규형(1NF)
    • 모든 속성은 반드시 하나의 값을 가져야 한다.
    • 원자성 만족

  • 위 테이블은 전화번호를 여러개 가지고 있어 원자값이 아니다.

 

 

  • 전화번호 컬럼을 1정규화한 모습

 

  1.  제2정규형(2NF)
    • 일반 속성은 주식별자 전체에 종속적이어야 한다.
    • 완전함수적종속 만족(부분함수 종속 제거)
    • 완전 함수적 종속을 만족한다는 말은, 테이블에서 기본키가 복합키(키1, 키2)로 묶여있을 때, 두 키 중 하나의 키만으로 다른 컬럼을 결정지을 수 있으면 안된다는 뜻이다.

  • Manufacturer과 Model이 키가 되어 Model Full Name을 알 수 있다.
  • Manufacturer Country는 Manufacturer로 인해 결정된다. (부분 함수 종속)
  • 따라서, Model과 Manufacturer Country는 아무런 연관관계가 없는 상황이다.(완전 함수적 종속 충족을 못함)

 

 

  • 연관 관계가 없는 컬럼을 다른 테이블로 2차 정규화!

 

  1. 제3정규형(3NF)
    • 일반속성 간에는 종속성이 없어야 한다.
    • 이행 함수 종속성 제거(A → B, B → C면 A → C가 성립)
    • 2NF가 진행된 테이블에서 이행적 종속을 없애기 위해 테이블을 분리하는 것

릴레이션이 2NF에 만족한다.
기본키가 아닌 속성들은 기본키에 의존한다.

  • 현재 테이블에서는 Tournament와 Year이 기본키다. Winner는 이 두 복합키를 통해 결정된다.
  • 하지만 Winner Date of Birth는 기본키가 아닌 Winner에 의해 결정되고 있다.

 

 

  • 따라서 위와 같이 분리하고 조인을 통해 연결을 해줄 수 있다!

 

기능 향상

  • 정규화 -> 입력 / 수정 / 삭제 기능 향상
  • 반정규화 -> 조회 기능 향상

 

트랜잭션의 특징(ACID)

  • 원자성(Atomicity) : 트랜잭션 작업은 모두 수행되거나 모두 수행되지 않아야 함
  • 일관성(Consistency) : 트랜잭션이 실행되기 전 데이터베이스의 내용이 잘못되어 있지 않다면 실행된 이후에도 데이터베이스 내용에 잘못이 있으면 안 됨
  • 격리성(Isolation) : 트랜잭션이 실행되는 도중에 다른 트랜잭션의 영향을 받으면 안 됨
  • 지속성(Durability) : 트랜잭션이 완료되면 변경 내용이 영구적으로 저장됨
반응형

'개발냥이 > SQLD' 카테고리의 다른 글

[SQLD] SQLD 개발자 자격증 시험 합격 수기  (0) 2023.04.08
[SQLD] 2과목 SQL 기본 및 심화 정리  (0) 2023.03.17
[SQL_ORACLE] GROUP BY와 HAVING  (0) 2023.03.10
[SQLD] 정규화(Nomalization)  (0) 2023.02.23
[SQLD] 관계  (0) 2023.02.06
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함