[SQL Developer] 제31회 SQLD 시험 후기


 - 일시: 2018-12-01 (토요일) 13:00 ~ 14:30

 - 장소: 건국대학교 공학관


 > 다음 글 (2/2) [SQL Developer] 제31회 SQL 개발자 자격검정시험 후기 및 출제 문제 정리 (2)


2018년 12월 올해의 마지막 SQLD 시험을 보고왔다.


시험 보고 온 느낌은 "하.. 정리를 좀 해둘껄 헷갈리는 내용이 너무 많네.." 


역시 대충하면 생각이 잘 나지 않는다.


평소에 그래도 개발하면서 쿼리 작성을 웬만큼 했으니 그냥 보면 되겠지 싶었는데 


생각보다 꼼꼼하게 공부했어야 했던것 같다.



[건국대학교 SQLD 시험장]


 시험 장소가 조금 헷갈려서 많이들 헤메는 듯한 모습들이 보였다.


B동이라고 되어 있어서 들어갔더니 별관이라고 A4용지를 적어놔서 다들 헷갈려서 물어보면서 올라갔다.


시험시간이 다가와 OMR 카드 나눠주시면서 컴퓨터용사인펜이 필요한 사람들에게 나눠주셨다. (다행)


시험 시간은 총 90분(13:00 ~ 14:30), 시험 문제는총 50문제(객관식 42개, 주관식8개)


이후 내용은 시험에 나왔던 문제와 관련된 내용을 작성하였습니다.


문제 그대로를 외우긴 힘드니까요 ㅎㅎ..


빨간 글씨정답이거나 정답에 관련된 내용입니다. 해당 개념을 이해하고 외우시면 될 것 같습니다.




과목1 데이터 모델링의 이해

제 1장 데이터 모델링의 이해

제1절 데이터 모델의 이해

1. 데이터 모델링의 중요한 세 가지 개념

개념 

복수/집합개념

타입/클래스 

개별/단수개념

어커런스/인스턴스 

어떤 것

(Thing) 

엔터티 타입(Entity Type) 

엔터티(Entity) 

엔터티(Entity) 

인스턴스(Instance)

어커런스(Occurrence) 

어떤 것 간의 연관

(Association between Things)

관계(Relationship) 

페어링(Pairing) 

어떤 것의 성격

(Characteristic of a Thing)

속성(Attribute) 

속성값(Attribute Value) 


제2절 엔터티

제3절 속성


제4절 관계

1. 관계의 표기법

1) 관계명: 관계의 이름

2) 관계차수: 1:1, 1:M, M:N

3) 관계선택사양: 필수관계, 선택관계


제5절 식별자

1. 식별자의 분류체계

분류 

식별자 

설명 

대표성 여부 

주식별자 

엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이며,

타 엔터티와 참조관계를 연결할 수 있는 식별자 

보조식별자 

엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이나 

대표성을 가지지 못해 참조관계 연결을 못함 

스스로 생성 여부

내부 식별자 

엔터티 내부에서 스스로 만들어지는 식별자 

외부 식별자 

타 엔터티와의 관계를 통해 타 엔터티로부터 받아오는 식별자 

속성의 수

단일 식별자 

하나의 속성으로 구별된 식별자 

복합 식별자 

둘 이상의 속성으로 구성된 식별자 

 대체 여

본질 식별자 

업무에 의해 만들어지는 식별자 

인조 식별자 

업무적으로 만들어지지는 않지만

원조식별자가 복잡한 구성을 가지고 있기 때문에 인위적으로 만든 식별자 


2. 식별자 관계로만 설정할 경우의 문제점

- 식별자 관계만으로 연결된 데이터 모델의 특징을 주식별자 속성이 지속적으로 증가할 수 밖에 없는 구조로서 새발자 복잡성과 오류가능성을 유발시킬 수 있는 요인이 될 수 있다.


3. 비식별자 관계로만 설정할 경우의 문제점

- 비식별자 관계로만 데이터 모델링을 전개하다보면 SQL구문에 많은 조인이 걸리게 되고 그에 따라 복잡성이 증가하고 성능이 저하되게 되는 것이다.


제 2장 데이터 모델과 성능

제1절 성능 데이터 모델링의 개요

1. 성능 데이터모델링 - 정독 한 번 하기

2. 성능 데이터모델링 수행 절차

제2절 정규화와 성능

1. 정규화 단계

(제 1정규화, 제 2정규화, 제 3정규화)

제3절 반정규화와 성능

1. 반정규화를 통한 성능향상 전략

- 데이터를 조회할 때 디스크I/O량이 많아서 성능이 저하되거나 경로가 너무 멀어 조인으로 인한 성능저하가 예상되거나 컬럼을 계산하여 읽을 때 성능이 저하될 것이 예상되는 경우 반정규화를 수행

1) 반정규화 대상조사

① 범위처리빈도수 조사

② 대량의 범위 처리 조사

③ 통계성 프로세스 조사

④ 테이블 조인 개수

2) 다른 방법유도 검토

① 뷰(View) 테이블

② 클러스터링 적용

③ 인덱스의 조정

④ 응용 애플리케이션

3) 반정규화 적용

① 테이블 반정규화

② 속성의 반정규화

③ 관계의 반정규화


2. 반정규화의 기법
1) 테이블의 반정규화

기법분류 

기법 

내용 

테이블 병합 

1:1 관계 테이블병합 

1:1 관계를 통합하여 성능향상 

1:M 관계 테이블병합 

1:M 관계 통합하여 성능향상 

슈퍼/서브타입 테이블병합 

슈퍼/서브 관계를 통합하여 성능향상 

테이블 분할

직분할 

컬럼단위의 테이블을 디스크 I/O를 분산처리 하기 위해 테이블을 1:1로 분리하여 성능향상(트랜잭션의 처리되는 유형을 파악이 선행되어야 함)

수평분할 

로우 단위로 집중 발생되는 트랜잭션을 분석하여 디스크 I/O 및 데이터접근의 효율성을 높여 성능을 향상하기 위해 로우단위로 테이블을 쪼갬(관계가 없음)

테이블 추가

중복테이블 추가 

다른 업무이거나 서버가 다른 경우 동일한 테이블 구조를 중복하여 원격조인을 제거하여 성능을 향상 

통계테이블 추가 

SUM, AVG 등을 미리 수행하여 계산해 둠으로써 조회 시 성능을 향상 

이력테이블 추가

이력테이블 중에서 마스터 테이블에 존재하는 레코드를 중복하여 이력테이블에 존재하는 방법은 반정규화의 유형 

부분테이블 추가 

하나의 테이블의 전체 컬럼 중 자주 이용하는데 자주 이용하는 집중화된 컬럼들이 있을 때 디스크 I/O를 줄이기 위해 해당 컬럼들을 모아놓은 별도의 반정규화된 테이블을 생성 


2) 컬럼 반정규화

반정규화 기법

내용 

중복컬럼 추가 

 조인에 의해 처리할 때 성능저하를 예방하기 위해 즉, 조인을 감소시키기 위해 중복

된 칼럼을 위치시킴 

파생컬럼 추가

 트랜잭션이 처리되는 시점에 계산에 의해 발생되는 성능저하를 예방하기 위해 

미리 값을 계산하여 갈럼에 보관함. Derived Column이라고 함

이력테이블 컬럼 추가 

 대량의 이력데이터를 처리할 때 불특정 날 조회나 최근 값을 조회할 때 나타날 수있는 

성능저하를 예방하기 위해 이력테이블에 기능성 칼럼

(최근값 여부. 시작과 종료일자 등)을 추가함

PK에 의한 컬럼 추가 

 복합의미를 갖는 PK를 단일 속성으로 구성하였을 정우 발생됨.

단일 PK안에서 특정값을 별도로 조회하는 경우 성능저하가 발생될 수 있음 

이 때 이미 PK안에 데이터가 존재하지만 성능향상을 위해 

일반속성으로 포함하는 방법이 PK의한 칼럼추가 반정규화임

응용시스템 오작동을 위한 컬럼 추가 

 업무적으로는 의미가 없지만 사용자가 데이터처리를 하다가 잘못 처리하여 

원래 값으로 복구하기를 원하는 경우 이전 데이터를 임시적으로 중복하여 보관하는 기법.

컬럼으로 이것을 보관하는 방법은 오작동 처리를 위한 임시적인 기법이지만 이것을

이력데이터 모델로 풀어내면 정상적인 데이터 모델의 기법이 될 수 있음


3) 관계 반정규화

반정규화 기법

내용 

중복관계 추가 

데이터를 처리하기 위한 여러 경로를 거쳐 조인이 가능하지만 이 때 발생할 수 있는 성능저하를 예방하기 위해 추가적인 관계를 맺는 방법이 관계의 반정규화임 


제4절 대량 데이터에 따른 성능

1. 대량 데이터 발생에 따른 테이블 분할 개요

1) 수평 분할: 컬럼단위로 분할하여 I/O경감

2) 수직 분할: 로우단위로 분할하여 I/O경감


제5절 데이터베이스 구조와 성능

1. 슈퍼/서브 타입 데이터 모델의 성능고려 방법

1) 슈퍼/서브타입 데이터 모델의 변환

① 개별로 발생되는 트랜잭션에 대해서는 개별 테이블로 구성 (One to One)

② 슈퍼타입 + 서브타입에 대해 발생되는 트랜잭션에 대해서는 슈퍼타입 + 서브타입 테이블로 구성 (Plus)

③ 전체를 하나로 묶어 트랜잭션이 발생할 때는 하나의 테이블로 구성 (Single)


구분 

One To One Type 

Plus Type 

Single Type 

특징 

개별테이블 유지 

슈퍼 + 서브타입 테이블 

하나의 테이블 

확장성 

우수함 

보통 

나쁨 

조인성능 

나쁨 

나쁨 

우수함 

I/O량 성능 

좋음 

좋음 

나쁨 

관리용이성

좋지않음 

좋지않음 

좋음 

트랜잭션 유형에 따른 

선택 방법

개별 테이블로 접근이 

많은 경우 선택 

슈퍼 + 서브 형식으로 데이터를 처리하는 경우 선택 

전체를 일괄적으로 

처리하는 경우 선택 



제6절 분산 데이터베이스와 성능

1. 데이터베이스 분산 설계시 효과

- 성능이 중요한 사이트에 적용

- 공통코드, 기준정보, 마스터 데이터 등에 대해 분산환경을 구성

- 실시간 동기화가 요구되지 않을 떄, 실시간의 업무적인 특징을 가지고 있을 때 분산 환경 구성

- 특정 서버에 부하가 집중이 될 때 부하를 분산할 때

- 백업 사이트를 구성할 때 간단하게 분산기능을 적용하여 구성


+ Recent posts