개체-관계 모델(ER 모델)
1976 년 Chen 에 의해 제안된 E-R 모델은 개념적 모델에서 가장 일반적으로 사용되고 있는
모델로서 그 모델이 지니고 있는 단순성 때문에 현재 광범위한 응용 분야에서 사용되고 있
습니다. E-R 모델은 다음과 같은 목적으로 사용되고 있습니다.
■데이터에 대해 관리자, 사용자, 프로그래머들이 서로 다르게 인식되고 있는 뷰들을 하나
로 통합할 수 있는 단일화된 설계안을 만들기 위해서입니다.
■서로 다른 뷰들을 충족시킬 수 있는 데이터 처리와 제약조건 등의 요구사항 들을 정의하
기 위해서입니다. E-R 모델은 E-R 도표 (E-R Diagram : ERD)로 표현됩니다. ERD 는 최종
사용자의 관점에서 데이터베이스를 그림 형태로 묘사한 것으로서,세 개의 기본요소인 개
체,관계, 그리고 속성으로 구성됩니다. 이들 각 요소는 앞장에서 설명한 바와 같이 실세
계에 존재하는 정보를 묘사하는데 가장 기본이 되는 개념입니다. 본 절에서는 이러한 각
요소들을 구체적으로 살펴보고자 합니다.
1.개체형
개체는 단순히 우리가 데이터 수집의 대상이 되는 정보 세계에 존재하는 사물(thing) 들로,
개념적인 것과 물리적인 것으로 나눌 수 있습니다. 여기서 개념적 개체는 장소, 사건 등과
같은 눈에 보이지 않는 것이고 물리적 개체는 물건 등과 같은 눈에 보이는 것입니다.즉 현
실 세계에 존재하는 사물로서 데이터베이스의 모델링의 대상이 된다면 개체로 정의할 수
있습니다. 각 개체는 속성 (attribute) 으로 알려진 특성들로 정의됩니다. 예를 들어 어떤
학생의 개체는 학번,이름, 평점, 등록일자, 생일, 주소, 전화번호, 전공 등으로 정의될 수
있습니다. 유사하게 어떤 항공기 개체의 속성으로서 항공기 편명,마지막 정비 일자, 총 비
행시간,마지막 정비일 등을 가집니다. 여기서 어떤 개체들은 공통적으로 여러 속성들을 공
유할 수 있는데 이런 개체들을 함께 모아 하나의 개체 집합 (entity set) 으로 정의할 수
있습니다. 예를 들어 Gigantic 대학교의 학생들은 STUDENT 라는 이름의 개체 집합으로 정
의할 수 있으며, 이는 각 학생 개체가 학번, 이름, 평점, 등록일자, 생일, 주소, 전화번호,
전공 등의 속성을 공유하기 때문입니다. 개체 집합을 ERD 로 나타낼 때는 다음과 같은 직
사각형으로 나타내고 이름을 붙입니다.
2.속성
속성 (attribute) 은 앞에서 설명한 바와 같이 개체의 구조를 나타내는 특성들을 의미합니
다. ERD에서 속성은 개체 집합을 나타내는 직사각형에 실선으로 연결된 타원형으로 표현되
며 각 타원형은 고유의 속성 이름을 갖습니다. 그림 1 에서 STU-DENT 개체 집합의 구조
는 LASTNAME,FIRSTNAME,INITIAL 이라는 속성들로 표현됩니다. 그림 1 STUDENT 엔티티 집
합의 속성들 각 속성은 가질 수 있는 값들의 범위가 있는데 이를 그 속성의 도메인(domain)
이라 합니다. 예를 들면 학생이라는 개체가 있을 때 학점이라는 속성의 도메인은 0.0 에서
4.0 사이의 실수값이며 주소라는 속성은 길이가 20자리 이내의 문자열로 정의할 수 있습니
다. 여기서 물론 각 속성이 가질 수 있는 값은 도메인 이외의 값을 갖지 못합니다.
그림 1 학생 개체집합의 속성들
일반적으로 서로 다른 개체 집합에 정의된 속성들은 같은 도메인을 공유할 수 있습니다.예
를 들면 학생 개체 집합에서 주소속성에 해당하는 도메인과 교수 개체 집합에서의 주소 속
성의 도메인은 같은 값들의 범위를 가질 수 있으므로 ADDRESS라는 속성 이름을 가질 수 있
습니다. 개체형에서 각각의 개체를 식별할 수 있는 것이 중요한데 이를 위해 여러 개의 속
성들로 이루어진 집합을 키 (key) 라고 하는데 이 속성들이 개체형 내의 각 개체를 유일하
게 지정합니다. 예를 들면 학번,성명, 주소, 생년월일, 학과의 속성들로 이루어진 학생 개
체형에서 학번 속성은 하나의 키가 될 수 있습니다.한 개체형에서 키는 여러 개가 있을 수
있으며 이 경우 두 개 이상의 속성들로 이루어진 키를 복합키(composite key) 라고 합니다.
위의 학생 개체형에서 {성명, 생년월일} 이 하나의 복합 키가 될 수 있습니다. 그림 2은
자동차 개체 집합의 구조를 보인 것이며, ID_NUM 이라는 속성에 밑줄을 친 것이 키를 의미
합니다. 그림 2 기본적인 E-R 모델 개체 정의 속성들은 또한 단순형 혹은 복합형으로 분
류할 수 있습니다. 예를 들면 주소 속성은 시,구,동,번지의 다른 속성들로 구성될 수 있는
데 이를 복합 속성 (composite attribute) 이라 합니다.또한 나이,성별 등의 속성은 더 이
상 다른 속성들로 구성될 수 없는 단순한 속성이므로 단순 속성 (simple attribute) 이라
합니다. 복합 속성은 여러 종류의 속성들로 구성된 것으로서 복잡한 정보를 표현할 때 중
요한 요소입니다. 주민등록번호와 같은 속성은 반드시 하나의 값만 존재하므로 이 속성은
단일치 속성 (single-valued attribute) 이라 하고, 어떤 사람의 전화번호와 같은 속성은
집, 핸드폰, 회사 전화번호와 같이 여러 개의 값을 가질 수 있습니다. 자동차의 색상 속성
도 차 지붕,차체, 외부의 색이 다를 수 있습니다. 이런 속성을 다중치 속성 (multi-valued
attribute)이라 합니다.
그림 2 기본적인 E-R 모델 개체 정의 그림 3 다중치 속성을 여러개의 새로운 속성들로 구분
그림 2 에서 보는 바와 같이 다중치 속성은 두 개의 실선으로 표시합니다. E-R 모델에서는
복합 속성, 다중치 속성들을 정의할 수 있지만,관계형 모델에서는 직접 구현이 불가능합니
다. 이를 위해서는 다 대다 관계나 다중치 속성을 관계형 모델에 맞게 수정하여야 합니다.
다중치 속성이 존재하면 설계자는 아래의 두 가지 중 하나를 선택합니다.
1)개체형 내에서 다중치 속성을 여러개의 새로운 속성들로 나눕니다.그림 2 에 서의 COLOR
속성에 대해 아래와 같은 새로운 속성들을 만들어 그림 3에서와 같이 CAR 개체형의 속성
들로 부착시킵니다.
2)다중치 속성을 구성하는 속성들로 구성된 새로운 개체형을 만듭니다. 이때 새로 운 개체
형은 원래 개체형과 다대일 관계를 맺게 합니다. 그림 4와 같이 CO-LOR 속성을 떼어내어
새로운 개체형을 만듭니다. 이때 새로운 개체형 COLOR 는 CAR 개체형과 다대일 관계입니
다. 그림 4 다중치 속성의 구성 속성들로 만들어진 새로운 개체형 마지막으로 어느 속성
은 유도 속성 (derived attribute) 으로 분류될 수 있습니다. 이 속성은 다른 속성의 값
으로부터 어떤 계산을 통해 새로운 값을 얻게되므로 데이터베이스상에 물리적인 값이 실
제로 존재하지는 않습니다. 예를 들면 어떤 사람의 나이 속성은 현재 날짜로부터 생년월
일 속성의 값을 뺌으로써 나이의 값을 유도할 수 있습니다. 그림 5 에서와 같이 유도 속
성은 점선으로 표시됩니다.
그림 4 다중치 속성의 구성 속성들로 만들어진 새로운 개체형 그림 5 유도 속성
3.관계
그림 6 개체 관계 그림 7 차수의 세 가지 유형들
실세계의 정보를 묘사하는 데 가장 중요한 개념은 개체와 더불어 관계 (rela-tionship) 입
니다. 관계는 개체들 사이에 존재하는 연관성을 의미합니다. 예를 들면 교수와 과목이라는
개체형이 있다고 할 때 "어느 교수가 무슨 과목을 가르치냐"라는 정보를 얻고자 할때는 위
의 두 개의 독립된 개체형들 만으로는 해당되는 답을 얻기가 힘듭니다. 이럴 때는 이 개체
형들 사이에 "교수는 과목을 가르친다"라는 관계를 부여해서 두 구성요소들 (개체)을 대응
시켜 놓을 때 유용한 정보를 얻게 됩니다. 그림 6 은 PROFESSOR 개체형와 CLASS 개체형 사
이에 존재하는 "teach"라는 관계를 보여줍니다. 이때 관계를 나타내기 위해서 두 개체형들
을 연결하는 실선들이 있고 그 사이에 마름모 모양의 표시를 해줍니다. 그림 6 개체 관계
관계의 차수 (degree)는 그 관계에 참여하는 개체형들의 개수를 의미합니다. 만약 관계가
한 개의 개체형 내에서 이루어진다면 그 관계를 단일 관계 (unary relation-ship)라 하고,
두 개의 개체형들이 연관되면 이진 관계 (binary relationship), 세 개의 개체형들이 연관
되면 삼진 관계 (ternary relationship) 라 합니다.
그림 7 차수의 세 가지 유형들 그림 7 에서 단일 관계의 예는 어떤 과목 (course) 을 이수
하기 위해서는 우선 다른 과목을 먼저 이수해야 한다는 선수 과목에 대한 관계를 의미합니
다. 여기서 과목들은 모두 COURSE 라는 개체 집합에 속하기 때문에 자기 자신과의 관계가
되는 것입니다. 이진 관계는 가장 많이 발생하는 관계이며,개념 설계를 단순화하기 위해서
는 삼진 관계나 혹은 그 이상의 개체형들이 참여하는 관계는 가능하면 이진 관계들로 분할
해서 재구성합니다.
4.연결
E-R 모델은 데이터베이스가 지켜야 할 제약조건들을 명시할 수 있습니다. 중요한 제약조건
중의 하나인 연결 (connectivity) 이라는 것이 있는데,이는 한 개체가 관계를 통하여 다른
개체와 관련되는 개체들의 수를 나타냅니다. 관계의 연결은 일대일 (1:1), 일대다 (1 : M),
다대다 (M : N)로 분류됩니다. E-R 도표에서는 관계의 연결을 1, N, M 을 사용하여 표현하
며 그림 8의 예와 같습니다.
그림 8 관계의 연결
일대일 (one to one) : X 에 속하는 한 개체는 Y 에 속하는 한 개체에만 연결되며,Y 에 속
하는 한 개체도 X 에 속하는 개체에만 연결됩니다.
일대다 (one to many) : X 에 속하는 한 개체는 Y 에 속하는 한 개체에만 연결되며,Y에 속
하는 한 개체는 X 에 속하는 여러 개체들과 연결됩니다.
다대다 (many to many) : X 에 속하는 한 개체는 Y 에 속하는 여러 개체들과 연결될 수 있
으며, Y 에 속하는 한 개체도 X 에 속하는 여러 개체들과 연결될 수 있습니다. 그림 8관계
의 연결
5.카디날리티
카디날리티 (cardinality) 란 관계에 참여하는 하나의 개체에 대해 다른 개체형에서 몇 개
의 개체가 참여하는지를 나타냅니다. 예를 들면 한 명의 학생이 1 개 이상 6 개 이하의 과
목에 등록할 수 있다면 카디날리티는 (1, 6) 입니다. "한 명의 교수는 최대 3 개의 과목을
가르칠 수 있다"면 (0, 3)입니다. 카디날리티는 (min, max) 의 한 쌍의 값으로 표현하는데
여기서 min 은 관계에 참여하는 개체의 최소 개수, max는 관계에 참여하는 최대 개수를 각
각 의미합니다. 여기서 max 의 값이 m 으로 표시되면 최대 개수에 제한이 없음을 의미합니
다. 그림 9 에서 PROFESSOR-CLASS 의 관계를 살펴보면 다음과 같이 해석할 수 있습니다.
1)PROFESSOR-CLASS 는 일대다 관계입니다.
2)PROFESSOR 의 카디날리티는 (0, 3) 이다.
즉 각 교수는 3 개 이하의 과목을 가르칠 수 있습니다.
3)CLASS 의 카디날리티는 (1, 1) 이다.
즉 각 과목을 가르치는 교수는 반드시 1 명이어야 한다.
그림 9 E-R 다이어그램에서의 카디날리티
존재 종속
만약 한 개체의 존재가 다른 개체(들) 의 존재에 영향을 받는다면 이를 존재 종속 (existe
nce-dependent)이라 합니다. 예를 들어 어느 보험회사가 J.H.Callifante 라는 사원과 그의
부양가족들에게 보험 혜택을 준다고 할 때 EMPLOYEE, DEPEN-DENT 라는 개체형들을 정의한
다고 합시다. J. H. Callifante 에게 Jill, Annelise, Jorge 라는 3 명의 부양가족이 있다
면 부양가족 3 명은 J. H. Callifante 없이는 보험 혜택을 받을 수 없을 것입니다.다시 말
해서 부양가족 3 명의 정보가 DEPENDENT 라는 테이블에 존재하지만 EMPLOYEE 와 연관지어
있을 때만 존재하게 됩니다. 이러한 것을 존재 종속이라 합니다. 만약 J. H. Callifante가
직장을 그만 두어 테이블에서 없어지게 되면 부양가족 3 명도 함께 없어지게 됩니다. 여기
서 DEPENDENT 의 키는 EMPLOYEE 의 키인 E_NUM 과 DEP_NUM 으로 구성됩니다. 두 개의 테이
블들을 연결시켜 보면 J. H. Callifante 는 3 명의 부양가족이 있고 W. K. Smithson 은 부
양가족이 없음을 알 수 있습니다.
7.관계 참여
관계에 참여하는 개체들은 선택적 (optional) 이거나 의무적 (mandatory) 입니다. 어떤 개
체형에서의 의무적이란 그 개체형의 모든 개체는 반드시 관계를 이루는 다른 개체형에서의
개체와 연관이 있어야 합니다. 어떤 개체형에서의 선택적이란 그 개체형의 어떤 개체는 관
계를 이루는 다른 개체형에서의 개체와 연관이 없어도 됩니다. 이를 카디날리티 (min,max)
로도 표현할 수 있는데 선택적인 경우는 min 의 값이 0이 되며 의무적일 때는 1이 됩니다.
그림 10 CLASS가 PROFESSOR 에 선택적인 관계 그림 10 와 같이 CLASS 의 각 개체는 반드시
PROFESSOR 의 한 개체에 의해 가르쳐지므로 PROFESSOR는 CLASS 에 대해서 의무적입니다.또
한 PROFESSOR 의 어떤 개체는 CLASS 의 개체를 가르치지 않아도 되므로 선택적입니다.어떤
개체형이 선택적이라는 것을 표시하려면 그 개체형을 나타내는 마름모에 작은 원으로 표시
합니다. 그림 11과 12은 선택적인 예와 의무적인 예를 보여주고 있습니다.
그림 10 CLASS가 PROFESSOR에 선택적인 관계 그림 11 SECTION이 COURSE에 의무적인 관계 그림 12 COURSE 와 SECTION이 서로 의무적인 관계
8.약 개체형
일반적으로 실세계에서 키를 자체적으로 만들 수 없는 개체형들이 존재하게 되는데, 이 경
우 각 개체들을 식별하지 못하게 되는 문제가 발생합니다. 어떤 개체형이 다음의 두 가지
조건을 만족하면 약 개체형 (weak entity type) 이라 합니다.
1)그 개체형이 존재 종속이어야 합니다.
2)그 개체형의 키가 자체적으로는 존재하지 않습니다.따라서 약 개체형은 이 개 체형과 관
계를 맺는 다른 개체형에 있는 키를 계승받아서야 키가 존재할 수 있습니다. 예를 들어
7절에서 설명한 존재종속인 DEPENDENT 개체형에서 DEP_NUM 만으로는 자체적으로 키를 만
들 수 없다고 하면, 이때 이 개체형과 관계를 갖는 EMPLOYEE 의 키 EMP_NUM 을 계승받아
DEPT_NUM 과 함께 키를 만들 수가 있습니다. 따라서 DEPENDENT 의 키 EMP_NUM, DEP_NUM
에서 EMP_NUM 은 EMPLOYEE 개체형으로부터 계승된 것입니다. 약개체형은 그림 13 에서와
같이 E-R 두 겹의 직사각형으로 표시됩니다. 약개체형은 반드시의 무적(mandatory) 으로
명시해야 합니다. 이는 만약 선택적으로 명시하면 관계에 참여하지 않는 개체들이 있게
되므로, 그 개체들을 식별할 수가 없기 때문입니다.
그림 13 약 개체형
9.재귀 개체형
재귀 개체형 (recursive entity type)은 같은 개체형에 속한 개체들 사이에 존재하는 관계
를 가진 개체형입니다. 이런 특성은 단일 관계 (unary relationship) 일 때 나타납니다.예
를 들면 어떤 과목 A 를 이수하기 위해서 과목 B 를 먼저 이수해야 한다면 과목 A 나 B 가
다 과목이란 개체형에 속하므로 이 경우 COURSE 는 재귀 개체형이 됩니다. 이를 ERD 로 표
현하면 그림 14 와 같으며, 이에 대한 데이터의 예를 테이블로 표시하면 다음과 같습니다.
그림 14 재귀 개체형
10.복합 개체형
관계형 모델에서는 관계를 구현할 때 기본적으로 일대다 (일)의 관계를 표현합니다.따라서
다대다의 관계를 일대다의 관계로 전환할 필요가 있습니다.이때는 다대다 관계에 참여하는
각 개체형의 키를 모두 모아서 하나의 개체형을 만드는데 이 개체형을 복합 개체형 (comp-
osite entity type) 이라 합니다. 따라서 복합 개체형은 다대다에 참여하는 개체형들 사이
에 다리 역할을 하는 개체형이라 할 수 있습니다. 그림 15 은 다대다 관계인 COURSE와 STU
DENT 개체형들 가운데에 복합 개체형인 ENROLL 이 존재한다는 것을 보여줍니다. 여기서 EN
EOLL 의 키는 (CRSE_ NUM, S_NUM) 이며 이는 COURSE와 STUDENT의 각 키들을 계승받은 것입
니다. 또한 복합 개체형은 GRADE 와 같은 자기 자신만의 속성들을 가질 수 있습니다. 그림
16 은 ERD의 복합 개체형의 예를 보여주며, 이는 직사각형 안의 마름모로 표현됩니다.
그림 15 M:N 관계를 1:M 관계로 변환
11.일반화
대부분의 회사에서는 다양한 자격이나 기술을 가진 고용인들을 채용합니다.예를 들면 항공
회사에서 조종사 혹은 다른 여러 기술을 가진 고용인들을 채용할 경우, 서로 다른 여러 유
형의 고용인들을 하나의 개체형에 표현하는 것은 적합하지 못합니다.예를 들면 조종사라는
고용인은 최저비행시간, 비행기노선 등과 같은 조종사에게만 적용되는 속성들이 필요하기
때문입니다. 그러므로 서로 다른 속성들을 가지고 있는 고용인들이 모두 함께 EMPLOYEE 라
는 단일 개체형에 표현된다면 많은 null값 (null value) 들이 발생함으로써 문제가 발생하
게 됩니다.
그림 16 복합 개체형 표 1 단일 개체형에 표현함으로써 발생되는 널값
표 1 에서 보는 바와 같이 조종사와 다른 고용인들을 함께 하나의 EMPLOYEE 개체형에 표현
할 경우 R.B.Reynolds 와 W.T.Massey 라는 조종사 이외의 다른 고용인에게는 E_FLTH-OURS,
E_CHKDATE,AC_NUM 등의 속성이 해당되지 않으므로 여기에는 null 값이 발생할 것입니다.표
1 단일 개체형에 표현함으로써 발생되는 null 값 다행히 이런 문제는 한 개체형을 공통 속
성들을 갖는 여러 개체형들로 나누어 표현하는 일반화 계층 (generalization hierarchy)으
로 쉽게 해결할 수가 있습니다. 즉 개체형들간에 유사성이 존재할 때 이 유사성을 모아 또
하나의 새로운 개체형을 정의내리는 것을 일반화라고 합니다.다음의 예제를 통해 일반화의
개념에 대해서 살펴보기로 합시다. 그림 17 일반화 계층 표 2 상위/하위 개체형 그림 17는
EMPLOYEE 에 대해서 일반화 계층으로 표현한 것입니다.여기서 EMPLOYEE 에 속한 사원 개체
들을 직급에 따라 PILOT, MECHANIC, ACCOUN-TANT 의 개체형들로 세분화하여 표현했습니다.
이 경우 EMPLOYEE를 수퍼형(super-type)이라 하며, PILOT, MECHANIC, 그리고 ACCOUNTANT를
각각 서브형(subertype) 이라 합니다. 일반화 계층에서 상위 개체형인 수퍼형과 하위 개체
형인 서브형과는 일종의 부모-자식 관계가 성립하며, 이를 IS-A 관계라고 합니다. 예를 들
면 "PILOT IS-A EMPLOYEE"이고 "MECHANIC IS-A EMPLOYEE"임을 알 수 있으며, 이는 각 서브
형에 속한 모든 개체들이 수퍼형에 반드시 포함되기 (include) 때문입니다.
표 2 상위/하위 개체형 그림 18 중복 조건을 가진 일반화 계층
그림 18은 EMPLOYEE수퍼형과 PILOT서브형과의 관계를 테이블 형태로 나타낸 것입니다. EMP
LOYEE 수퍼형은 E_NUM, E_NAME, E_DOB 라는 속성들을 가지며, 이는 여기에 속한 모든 개체
들이 공통적으로 고용인이기 때문입니다. 여기서 PILOT 서브형은 위의 속성들 외에 E_FLTH
OURS, E_CHKDATE, AC_NUM,E_IFHRS 등의 자기 자신만의 고유의 속성들을 추가로 가질 수 있
음을 알 수 있습니다. 마찬가지로 MECHANIC, ACCOUNTANT 의 서브형들도 각각 위의 속성들
외에 고유의 속성들을 가질 수 있습니다. 이는 이 개체형들은 EMPLOYEE 개체형에 속하지만
직종별로 각각 고유의 업무에 맞는 속성들을 갖고 있기 때문입니다. 일반화를 통해 나타나
는 중요한 특성은 수퍼형에 서브형과의 공통적인 속성을 표시하고,수퍼형의 정보가 서브형
에 상속 (inheritance) 된다는 것입니다. 일반화를 통해 나타나는 상속은 개체형의 정의를
단순화시키고, 기존에 정의된 개체형을 이용해 새로운 개체형을 쉽게 정의할 수 있게 해줍
니다. 예를 들면,PILOT 라는 개체형을 새로 정의할 때, 이 개체형에만 속한 고유의 속성들
만을 정의하면 되며, 나머지 속성들은 상위 개체형인 EMPLOYEE로부터 자연스럽게 상속받을
수 있습니다. 그림 18 수퍼형과 서브형과의 관계는 중복 (overlapping : Gs) 과 해체 (dis
joint : G) 의 제약조건으로 표현할 수 있습니다. 수퍼형에 속한 한 개체가 여러 수퍼형에
중복하여 속할 수 있으면 중복 조건이라 하며, 단지 하나의 서브형에만 속할 수 있으면 해
체 조건이라 합니다. 예를 들면, 그림 8.17 에서 EMPLOYEE 에 속한 한 개체는 반드시 세개
의 서브형들 중 한 개체형에만 속하여야 하며,그림 18 에서 PERSON 에 속한 한 개체는 EMP
LOYEE 이면서 STUDENT 에도 속할 수가 있음을 알 수 있습니다.
12.요약
그림 19 는 앞에서 살펴본 내용의 전체적인 요약을 보여주고 있습니다.
'용어' 카테고리의 다른 글
아파치(apache)와 톰캣이란? (0) | 2017.01.16 |
---|---|
웹 동작방식 (0) | 2017.01.15 |
MYSQL이란? (0) | 2017.01.15 |
Load Average에 대하여 (0) | 2017.01.14 |
데이터베이스 (0) | 2017.01.12 |