SQLD 자격증 1과목 데이터 모델링의 이해 파트 요약정리한 내용입니다.
목차
데이터 모델링의 이해
모델링의 특징
현실 세게 -> 추상화 / 단순화 / 명확화 -> 모델
-현실 세계를 일정한 형식에 맞추어 표현하는 추상화의 의미
-업무 분석, 업무 형상화를 위해 진행하는 사전단계의 작업으로서 데이터베이스 구축을 위한 사전 작업의 의미
-복잡한 현실을 제한된 언어나 표기법을 통해 이해하기 쉽게 하는 단순화의 의미
-애매모호함을 배제하고 누구나 이해 가능하도록 정확하게 현상을 기술하는 명확화의 의미
데이터 모델링 시 주의해야 할 점 - 중복 / 비유연성 / 비일관성
중복 - 같은 시간 같은 데이터를 제공해야 한다
비유연성 - 사소한 업무변화에 데이터 모델이 수시로 변경되면 안 된다. 데이터 정의를 사용 프로세스 와 분리시킨다.
비일관성 - 데이터 간 상호 연관 관계에 대해 명확히 정의해야 한다.
데이터 모델링 단계
개념적 데이터 모델링
- 추상화 수준이 가장 높고 업무 중심적이고 포괄적인 모델링 진행, 전사적 데이터 모델링, EA 수립 시 많이 사용
논리적 데이터 모델링
- 시스템으로 구축하고자 하는 업무에 대해 KEY, 속성, 관계 등을 정확하게 표현, 재사용성이 높음
물리적 데이터 모델링
- 실제로 데이터베이에서 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계
데이터 독립성 이해
구조
외부 스키마 - 사용자 관점 접근 특성에 따른 스키마 구성 ( 개개 사용자 또는 응용 프로그래머가 보는 DB 스키마 )
개념 스키마 - 통합 관점 ( 모든 사용자 관점을 통합한 전체 DB )
내부 스키마 - 물리적 저장 구조 ( 물리적 장치에서 데이터가 실제로 저장되는 스키마 )
데이터 독립성
논리적 독립성 - 개념 스키마를 변경하게 되면 외부스키마에 영향을 받지 않음
물리적 독립성 - 내부 스키마가 변경되어도 외부/개념 스키마는 영향을 받지 않음
사상(Mapping)
논리적 사상 : 외부스키마 - 개념스키마
물리적 사상 : 개념 스키마 - 내부스키마
데이터 모델링의 3요소
업무가 관여하는 어떤 것 ( Things )
어떤 것이 가지는 성격 ( Attributes )
업무가 관여하는 어떤 것 간의 관계 ( Relationships )
좋은 데이터 모델의 요소
완전성 - 업무에 필요한 모든 데이터가 모델에 정의
중복배제 - 하나의 DB내에 동일한 사실은 한 번만 기재
업무규칙 - 많은 규칙을 사용자가 공유하도록 제공
데이터 재사용 - 데이터가 독립적으로 설계되어야 함
의사소통 - 업무규칙은 엔티티, 서브타입, 속성, 관계 등의 현태로 최대한 자세히 표현
통합성 - 동일한 데이터는 한 번만 정의, 참조 활용
데이터 모델 표기법
1976년 피터첸 E-R-MODEL 개발
- IE 표기법
- Baker 표기법
ERD 작업순서
1. 엔티티 그림 그리기
2. 앤티티 배치 ( 중요도 순으로 왼쪽 위부터 배치 )
3. 엔티티 관계 설정
4. 관계명 기술
5. 관계의 참여도 기술
6. 관계필수여부
엔티티
업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합적인 것
- 현업 업무에서 사용하는 용어를 사용하며 약어 사용을 금지한다. 단수 명사 사요앟며 고유한 이름을 사용한다. 생성대로 의미를 부여한다.
1. 반드시 해당 업무에서 필요하고 관리하고자 함
2. 유일한 식별자에 의해 식별 가능
3. 두 개 이상의 인스턴스의 집합
4. 업무 프로세스에 의해 이용되어야 함
5. 반드시 속성이 있어야 함
6. 다른 엔티티와 최소 1개 이상의 관계가 있어야 함 ( 통계성/코드성 엔티티는 관계 생략 가능 )
엔티티의 분류
유무형에 따른 분류 - 유개사
유형 - 물리적 형태
개념 - 개념적 정보
사건 - 업무 수행 시 발생
발생시험에 따른 분류 - 기중행
기본 - 업무에 원래 존재하는 정보, 타 엔티티의 부모 역할, 자신의 고유한 주식별자를 가짐
중심 - 기본 엔티티로부터 발생, 다른 엔티티와의 관계로 많은 행위 엔티티 생성
행위 - 2개 이상의 부모 엔티티로부터 발생
속성
업무에서 필요로 하는 인스턴스로 관리하고자 하는 의미상 분리되지 않은 최소의 데이터 단위
- 한 개의 엔티티는 2개 이상의 인스턴스의 집합
- 한 개의 엔티티는 2개 이상의 속성을 가짐
- 한 개의 속성은 1개의 속성값을 가짐
속성 명명
1. 해당업무에서 사용하는 이름 부여
2. 서술식 속성명은 사용 금지
3. 약어 사용 금지
4. 구체적으로 명명하여 데이터 모델에서 유일성 확보
구성 방식의 분류
PK, FK, 일반 속성
속성의 분류 - 기본, 설계, 파생
기본 : 업무로부터 추출한 모든 일반적인 속성
설계 : 업무를 규칙 하기 위해 새로 만들거나 변형, 정의하는 속성
파생 : 다른 속성에 영향을 받아 발생하는 속성 빠른 성능을 낼 수 있도록 원래 속성의 값을 계산
도메인 - 속성에 대한 데이터타입, 크기, 제약사항 지정
관계 - 엔티티의 인스턴스 사이의 논리적인 연관성으로서 존재의 형태로서나 행위로써 서로에게 연관성이 부여된 상태
UML에서의 관계
연관관계(실선) : 항상 이용하는 관계 ( EX : 소속된다)
의존관계(점선) : 상대 행위에 의해 발생하는 관계 (EX : 줌
관계의 표기법
관계명 - 관계 이름
관계 차수 - 1;1, 1:M, M:N
관계선택사항 - 필수 관계, 선택관계
관계 체크사항
1. 2개의 엔터티 사이에 관심 있는 연관 규칙이 존재하는가?
2. 2개의 엔터티 사이에 정보의 조합이 발생하는 가 ?
3. 업무기술서, 장표에 관계연결에 대한 규칙 서술이 가능한가?
4. 업무기술서, 장표에 관계연결을 가능케 하는 동사가 존재하는가?
식별자 - 엔터티 내에서 인스턴스를 구분하는 구분자
식별자의 특징 - 유일성, 최소성, 불변성, 존재성
유일성 - 주식별자에 의해 모든 인스턴스들이 유일하게 구분
최소성 - 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 함
불변성 - 지정된 주식별자의 값은 자주 변하지 않아야 함
존재성 - 주식별자가 지정되면 반드시 값이 들어와야 함
식별자 분류 방법
대표성 여부에 따른 분류 - 주식별자/ 보조식별자
주식별자 : 엔티티 내에서 각 어커런스를 구분할 수 있는 구분자
보조 : 구분자이나 대표성이 없고 참조관계 연결할 수 없음
생성여부에 따른 분류 내부식별자/외부식별자
내부 식별자 : 스스로 생성되는 식별자
외부 식별자 : 타 엔터티로부터 받아오는 식별자
속성의 쑥에 따른 분류 - 단일 식별자 / 복합 식별자
단일 식별자: 하나의 속성으로 구성
복합 식별자: 2개 이상의 속성으로 구성
대체 여부에 따른 분류 - 본질식별자, 인조식별자
본질 식별자 : 업무에 의해 만들어지는 식별자
인조 식별자 : 인위적으로 만든 식별자
주식별자 도출 기준
해당 업무에서 자주 이용되는 속성
명칭 내역 등과 같이 이름으로 기술되는 것들은 될 수 없음
복합으로 주식별자로 구성할 경우 너무 많은 속성이 구성되지 않도록 최소한의 속성으로 구성
식별자 관계
주식별자
자식의 주식별자로 부모의 주식별자 상속받은 경우
- 부모로부터 받은 식별자를 자식 엔터티의 주식별자로 이용하는 경우
강한 연결 관계 표현, 실선으로 표기
식별자 관계로만 설정 시 주 식별자 증가로 오류 유발 가능
비식별자
부모 속성을 자식의 일반 속성으로 사용하는 경우
- 부모 없는 자식이 생성될 수 있는 경우
- 부모와 자식의 생명주기가 다른 경우
- 여러 개의 엔터티가 하나의 엔터티로 통합되어 표현되었는데 각각의 엔터티가 별도의 관계를 가지는 경우
- 자식엔터티에 별도의 주식별자를 생성하는 것이 더 유리한 경우
- SQL 문장이 길어져 복잡성이 증가되는 것을 방지
약한 연결 관계 표현, 점선으로 표기
비식별자 관계로만 설정 시 부모 엔터티와 조인하여 성능 저하
'IT경험공유 > DataBase' 카테고리의 다른 글
SQLD 기출 변형 문제 풀이/해설 - SUM(), MIN(),MAX(), COUNT(), AVG() (0) | 2023.03.21 |
---|---|
SQLD 48회 기출문제 복원 (0) | 2023.03.19 |
[DB] 데이터베이스 정규화 예시를 통한 완벽이해 (0) | 2023.03.15 |
DB/SQL-고급집계함수 ROLLUP, GROUPING SETS, CUBE (0) | 2023.03.14 |
[DB/SQL] 윈도우 함수 LEAD/LAG (Feat. Partition by ) (0) | 2023.03.13 |
댓글