-
데이터베이스 정보처리기사 실기 기출 용어 위주 내용 정리데이터베이스/정보처리기사 2016. 11. 11. 23:45
이 글로 알 수 있는 것
- 정보처리기사 실기 과목 중 데이터베이스 기출 용어와 그 내용을 알 수 있다.(2009년~2016년)
- 데이터베이스 전체 내용을 정리하고 싶으면 다음 글을 참고
2016-3
- trigger
- 특정 테이블의 데이터에 변경이 가해졌을 때 연쇄적으로 수행되는 프로시저
- DB가 미리 정해놓은 조건을 만족하거나, 어떤 동작이 수행되면 자동적으로 수행되는 동작을 의미한다
- 이벤트
- DB항목을 변경시키는 일의 발생을 의미한다.
- 그룹함수 종류
- max
- 최대값
- min
- 최소값
- count
- 튜플 수
- avg
- 평균
- sum
- 합산
- 이력관리
- 하나의 업무 단위가 시간이 흐름에 따라 발생하는 과거와 현재 데이터를 지속적으로 유지하는 관리 방법
- 이력관리 구분
- 선분 이력
- 관리하고 있는 데이터가 변경된 경우 변경되기 이전과 이후의 데이터를 모두 관리할 수 있도록 구성한 것
- 발생 이력
- 시간에 따라서 발생하는 데이터를 모두 관리할 수 있도록 구성한 것
- 진행 이력
- 업무가 진행되는 상태를 모두 관리할 수 있도록 구성한 것
- 이력 관리의 형태
- 시점 이력 관리
- 데이터의 변경이 발생한 시각만을 관리
- 변경 이력 관리
- 데이터 변경의 시작시점부터 그 상태의 종료시점까지를 진행 이력 데이터를 관리하는 식의 이력관리
2016-2
- meta data
- 데이터에 관한 구조화된 데이터, 다른 데이터를 설명해주는 데이터
- 메타데이터 구축을 위해서 다음과 같은 데이터 포맷을 사용한다.
- MARC, machine readable cataloging
- 코드화한 일련의 메타데이터
- 목록레코드르르 상호교환하기위해 미국의회도서관이 개발
- 즉 컴퓨터가 목록을 식별하여 축적/유통할 수 있도록 코드화한 일련의 메타데이터
- DC
- ONIX
- MODS
- data warehouse
- 다량의 데이터를 효과적으로 분석하고 정보화하고 효율적으로 사용하도록 한 데이터베이스
- 빠르고 정확한 의사결정 도와줌
- OLAP, online analytical processing
- 다차원으로 이뤄진 데이터로부터 통계적 요약정보 분석해 의사결정에 활용하는 방식
- 이용자가 직접 컴퓨터 이용해 데이터접근에 있어 필수적 시스템
- 데이터 웨어하우스를 다차원적으로 분석하고 시각화하는 시스템
- 이용자가 직접 DB검색, 분석해서 문제점, 해결책을 찾는 분석형 애플리케이션 개념
- OLAP의 종류
- DOLAP (desktop)
- 데이터를 pc로 내려받아 OLAP 수행
- ROLAP
- 관계형 데이터베이스와 SQL을 사용해 다차원 데이터를 저장 분석한다.
- MOLAP
- 다차원 데이터를 저장하기 위해 다차원 데이터베이스를 사용한다.
- 다차원 DB 기반 OLAP아키텍처
- HOLAP
- ROLAP+MOLAP
- data mining
- 데이터웨어하우스에 저장된 데이터집합에서 요구에따라 유용한 정보발견 기법
- 엄청난 데이터의 양을 유용한 정보로 가공하고자 하는 연구 중 한 분야
2016-1
- 관리기법/1 (2016-1)
- 한국정보사회진흥원 주도로 번역되어 오랜기간 국가기관표준방법론으로 역해왔던 '관리기법/1'
- 제약조건
- DB에 저장되는 데이터의 정확성을 보장해주기 위해 키를 이용하여 입력되는 데이터에 제한을 주는 것
- 삽삭갱 작업이 많이 동반되는 시스템의 경우 '제약조건'의 설정이 중요
- 참조 무결성 제약조건을 유지하기 위한 3방법
- cascade
- restrict
- set null
- $ drop table 테이블명 cascade/restrict
- cascade
- 참조 테이블을 연쇄적으로 제거한다.
- restrict
- restrict는 제한하다, 금지하다, strict는 엄격하다는 뜻인데 재차(re)엄격하게 구니까 금지한거
- 참조하는 테이블 있다면 제거안됨
2015-3
- DB의 정의
- 통합 데이터, integrated data
- 검색의 효율성을 위해 중복을 최소화한 데이터
- 저장 데이터, stored data
- 컴퓨터가 접근가능한 저장매체에 저장된 데이터
- 운영 데이터, operational data
- 조직 목표를 위해 존재가치 확실하고 반드시 필요한 데이터
- 공유 데이터, shared data
- 여러 프로그램들이 공동으로 사용하는 데이터
- DB의 특징
- 실시간 접근, real time accessibility
- 사용자 쿼리에 즉시 처리하고 응답한다.
- 계속 진화, continuos evolution
- 항상 최근의 데이터를 동적으로 유지한다.
- 동시 공유, concurrent sharing
- 여러사용자가 동시에 원하는 데이터를 사용 가능하다.
- 내용 기반 참조, content reference
- 데이터를 참조할 때 내용으로 참조한다.
- 독립성, independence
- 논리적 독립성
- app과 DB와의 관계 : 데이터의 논리적 구조를 변경하더라도 app에 영향 주지 않는다.
- 물리적 독립성
- app과 보조메모리와의 관계 : 새로운 저장장치의 추가에도 app에 영향 주지 않는다.
- MARC, machine readable cataloging
- 컴퓨터가 목록 데이터를 효율적으로 처리하도록 데이터를 컴퓨터가 인식할 수 있는 형식으로 변환시키고 정형화된 형식으로 배열해야한다.
- MARC는 컴퓨터가 목록 데이터를 식별해 축적하고 유통할 수 있도록 코드화한 메타데이터의 표준 형식이다.
- 상호 운용성, interoperability
- 동일 기종, 타 기종 간 통신할 수 있고, 정보교환, 일련 처리를 정확하게 실행할 수 있는 것
- MDR, metadata registry
- 메타데이터의 등록과 인증을 통해 메타데이터를 유지, 관리한다.
- 메타데이터의 명세를 공유하는 레지스트리
- 메타데이터를 사용해 데이터 접근/사용을 촉진한다.
2015-2
- 튜닝
- DB가 일정 성능을 유지할 수 있도록 비효율적 요소 제거하고 성능 개선위해 SQL 등 DB 의 여러 요소들을 조정/조율/최적화하는 작업이다.
- locking
- DB에서 동시성으로 인해 존재X데이터를 읽게되거나, 변경 데이터가 손실되는 등 부정적인 것을 방지위한 것.
- 즉 하나의 트랜잭션이나 세션에 사용되는 데이터를 다른 트랜젝션이나 세션은 접근 못하게 하는 것.
- 병행제어
- 병행제어란?
- 동시에 여러 개 수행시, DB 일관성 유지 위해 트랜잭션 간 상호작용을 제어하는 것
- 병행제어 기법
- locking
- locking
- 병행제어
- locking이란?
- 하나의 트랜젝션이 데이터액세스 하는동안, 다른 t이 그 데이터를 접근 할 수 없도록 하는 방법
- locking단위
- 로킹 단위 大 - lock 수 작다 - 관리 수월/병행성 수준down
- 로킹 단위 小 - lock 수 크다 - 관리 복잡/병행성 수준up
- selectivity
- =선택도 =분포도 =선택성
- 인덱스를 설계할 때에는 (selectivity)가 좋도록 설계해야한다.
- 인덱스의 (selectivity)는 인텍스 키 값당 행의 개수를 기준으로 산정한다.
- 분포도가 좋다 = 같은 키값을 가지는 튜플 수 적다 = 키 종류 다양하다
- selectivity 내용 더 추가
- 분포도가 좋다 = 해당 칼럼의 유니크한 데이터종류가 많다
- 인덱스로 적정한 분포도는 10%~15% 정도
- 분포도가 좋다 = 분포도 값이 낮으면서 데이터가 일정하게 분포돼있다.
- 분포도가 좋은 것을 인덱스로 선택해야 한다.
- 인덱스
- 튜플에 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 데이터 구조
- 인덱스 종류
- 기본 인덱스
- 기본키(PK)를 위한 인덱스
- RDBMS에서는 모든 PK에 자동 기본 인덱스 생성
- 보조 인덱스
- 기본 인덱스 외 인덱스
- 클러스터드 인덱스, clustered index
- 인덱스 테이블 키 값 순서와 튜플 물리적 순서를 동일하게 유지하는 인덱스
- (clustered)인덱스는 인덱스가 가리키는 데이터가 이미 정렬되어있어 최종 인덱싱 단계 없이 바로 데이터를 찾을 수 있다.
- 속도 향상에 매우 도움 된다.
- 넌-클러스터드 인덱스, non-clustered index
- (clustered)인덱스보다 성능 떨어지나 한 테이블에 여러 개의 인덱스 설정이 가능하다
- (non-clustered)인덱스는 한 특정값을 찾거나 많은 양 데이터 중 작은 범위를 찾을 때 유용하다.
- 클러스터링
- clustered index를 만들게되면 기본적으로 그 index key를 기준으로 물리적으로 데이터를 정렬(오름/내림차순)시켜 검색속도가 빨라진다.
2015-1
- 빅데이터
- DSMS
- data strem management system 데이터 스트림 관리 시스템
- 이상, anomaly
- 릴레이션 일부 속성들의 종속으로 인해 데이터 중복이 발생하고, 이런 중복으로 릴레이션 조작 시 문제가 발생하는 현상을 의미한다
- 정규화 과정
2014-3
- 데이터 마트
- 비교적 작은 규모의 데이터 웨어하우스
- OLAP연산
- 데이터를 변환시킬때 사용하는 연산
- OLAP연산 종류
- roll-up
- 더 요약된 정보보기
- drill-down
- 더 구체적인 정보보기
- drill-through
- 데이터웨어하우스/OLTP에 존재하는 상세데이터제 접근하기
- drill-across
- 다른 데이터큐브의 데이터에 접근하기
- pivoting
- (회전문을 피벗팅 게이트라함)
- 보고서의 행/열/페이지 차원을 바꾸보기
- slicing
- 다차원 데이터 항목을 다양한 각도에서 조회하고 자유비교 기능
- dicing
- (dice 주사위, dicing 주사위 놀이)
- slicing을 더 쪼개는 형태
- OLTP
- on-line transaction processing
- 주로 신용카드조회업무, 자동현금지급, 금융전산 부문에서 이용
2014-2
- 제약조건
- 실제 데이터의 논리적인 제약조건
- 릴레이션 인스턴스들이 만족해야하는 조건
- 무결성 제약 조건
- 무결성 제약조건은 DBMS가 무결성을 보장하기 위한 규칙.
- 무결성 제약조건의 종류
- 개체(entity) 무결성 제약조건
- PK는 유일하고 not null이어야한다.
- 참조(referential) 무결성 제약 조건
- FK는 null 또는 참조 R에 있는 PK값이다.
- mapping rule
- ER model을 relationsip data model로 변환하는 규칙
- 식별관계
- 부모 엔티티의 주식별자(PK)가 자식 엔티티의 외래식별자(FK)이자 동시에 주식별자(PK)가 되는 관계
- 식별관계는 실선으로 표시
- 비식별관계
- 부모 엔티티의 주식별자(PK)가 자식엔티티의 외래식별자(FK)이자 일반속성으로 전이
- 비식별관계는 점선으로 표시
2014-1
- 2016-2
2013-3
- (본문읽기)
- 빅데이터
- 클라우드
2013-2
- 정규화 과정
- 순수 관계 연산자
- 셀렉트, select, σ
- 조건을 만족하는 tuple 반환
- e.g. 19금 이상만: σ나이>19(고객)
- 프로젝트, project, π
- 주어진 attribute의 값으로만 구성된 tuple 반환
- e.g. 사는 곳은 궁금하지 않아: π이름,나이(고객)
- 디비전, divison, ÷
- 조인, join(2011-2),
- 공통 attirbute를 이용해 r1과 r2의 tuple들을 연결해 만들어진 새로운 tuple 반환
- 자연조인
- 중복 속성값 제거하는 조인은 자연 조인
2013-1
- 정규화 과정
- 함수 종속성
- 다치 종속성
2012-3
- 정규화 과정
- 부분 함수 종속
- 이행 함수 종속
2012-2
- cascade
- 부모r에서 수정이 발생하면 자식r의 FK값이 부모 릴레이션의 PK속성값으로 연쇄적으로 수정된다.
- view
- 가상 테이블
- 물리적으로 존재하지 않으나 마치 테이블처럼 보임
- 보안상, 조회용으로 이용한다.
- 인덱스
- 튜플에 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 데이터 구조
- 인덱스 종류
- 기본 인덱스
- 기본키(PK)를 위한 인덱스
- RDBMS에서는 모든 PK에 자동 기본 인덱스 생성
- 보조 인덱스
- 기본 인덱스 외 인덱스
2012-1
- data warehouse
- 다량의 데이터를 효과적으로 분석하고 정보화하고 효율적으로 사용하도록 한 데이터베이스
- 빠르고 정확한 의사결정 도와줌
- 관계형 데이터베이스, RDB
- 데이터를 열과 행으로 이뤄진 2차원의 릴레이션으로 표현하는 DB의 한 종류이다.
- MOLAP
- 다차원데이터를 저장하기위해 특수한 구조의 다차원DB를사용하고
- 데이터검색속도 향상위해 주기억장치속에 데이터큐브를 보관하는 구조를 가진다.
- ROLAP
- 관계형 데이터베이스와 SQL을 사용해 다차원 데이터를 저장 분석한다.
- HOLAP
- ROLAP+MOLAP
- 데이터큐브
- 데이터가 여러차원으로 모델링 되는 것
- 차원(dimension)과 사실(fact)로 정의된다.
2011-3
- 2016-3
2011-2
- 정규화 과정
2011-1
- 2015-3
2010-4
- subject area
- 데이터 모델링 기법 중 하나, subject area
- 관리하고자 하는 데이터그룹을 하위 'subject area'집합들로 분해하는 것
- subject area는 데이터 세분화의 기초가 되고, 하향식으로 분석함으로써 계층적 표현 가능
- data dictionary
- DB시스템 내에서 관리된다.
- DB에 저장되어있는 모든 데이터에 대한 정보를 유지, 관리한다.
- 시스템 카탈로그 내에는 데이터에 관한 데이터라고 하여 메타데이터라고도 한다
- DB시스템에 의해서만 액세스되고 갱신될 수 있다.
- data dictionary(데이터 사전) = system catalog(시스템 카탈로그)
- DBMS에서 사용되는 모든 파일, 속성, 변수의 목록
- 나중에 사용자가 DB를 사용하거나, 프로그래밍할 때 DB 내 어떤 자료가 있는지, 그 자료가 어떻게 정의되어 있는지를 쉽게 알수 있다.
- 시스템 카탈로그 = 데이터 사전
- 시스템 자신이 필요로하는 여러가지 객체(테이블, 뷰, 인덱스, DB, 접근권한 등)에 대한 정보를 포함하고 있는 시스템 데이터베이스
- full table scan
- 릴레이션에 있는 모든 tupe들을 순차적으로 읽어내는 스캔 방법이다.
- 분포도가 10%이하인 경우 '인덱스 스캔'이 효율적이지만,
- 분포도가 10~15% 그 이상인 경우에는 'full table scan'이 효율적이다
- RTRIM
- sql에서 수행한 RTRIM은 문자열의 오른쪽 공백 제거 시 사용하는 함수이다.
- LTRIM
- 왼쪽 공백 제거
- TRIM
- LTRIM & RTRIM
2010-2
- 무결성
- 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실세계의 실제 값이 일치하는 정확성을 의미한다
- 정규화 과정
2010-1
- 정규화, normalization
- '정규화' 간계가 진행될수록 중복감소, 갱신이상 감소로 무결성 제약조건을 시행하기 위해 필요한 코드 양도 줄어든다
- 그러나 성능상의 관점에서만 보면 높은 '정규화'단계를 만족하는 릴스키마가 최적인것은 아니다.
- 조인
- 분해되기전의 릴레이션을 대상으로 질의를 할 때는 'join'이 필요없지만,
- 분해된 릴레이션을 대상으로 질의할 때는 같은 정보를 얻기 위해 보다 많은 릴에 접근해야하므로 'join'의 필요성이 증가한다.
- 비정규화, denomalization
- 상황에따라 DB설계자는 응용의 요구사항에 따라 DB설계의 일부분을 'denormalization' 함으로써 데이터 중복/갱신 이상의 대가를 치루더라도 성능 상 요구를 만족시키기도 한다.
- 'denomalizaiton'은 빈번 수행되는 검색질의들의 수행속도 높이기 위해 이미 분해된 두 개 이상의 릴들을 합쳐 하나의 릴로 만드는 작업이다
- 'nomalization'된 데이터 모델을 통합하는 것이다.
2009-4
- 기본, 정규화 과정
2009-2
- 기본
2009-1
- 2016-1
추가
- transaction
- 트랜잭션
- DB에서 하나의 논리적 기능을 수행하기위한 연산집합. 작업의 논리적 단위
- 트랜잭션 특징
- ACID
- 원자성, atomicity
- 일관성, consistency
- 독립성, isolation
- 영속성, durability