ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터베이스 정보처리기사 실기 기출 용어 위주 내용 정리
    데이터베이스/정보처리기사 2016. 11. 11. 23:45

    이 글로 알 수 있는 것

    • 정보처리기사 실기 과목 중  데이터베이스 기출 용어와 그 내용을 알 수 있다.(2009년~2016년)
    • 데이터베이스 전체 내용을 정리하고 싶으면 다음 글을 참고

    2016-3

    • trigger
      • 특정 테이블의 데이터에 변경이 가해졌을 때 연쇄적으로 수행되는 프로시저
      • DB가 미리 정해놓은 조건을 만족하거나, 어떤 동작이 수행되면 자동적으로 수행되는 동작을 의미한다
    • 이벤트
      • DB항목을 변경시키는 일의 발생을 의미한다.
    • 그룹함수 종류
      • max
        • 최대값
      • min
        • 최소값
      • count
        • 튜플 수
      • avg
        • 평균
      • sum
        • 합산
    • 이력관리
      • 하나의 업무 단위가 시간이 흐름에 따라 발생하는 과거와 현재 데이터를 지속적으로 유지하는 관리 방법
    • 이력관리 구분
      • 선분 이력
        • 관리하고 있는 데이터가 변경된 경우 변경되기 이전과 이후의 데이터를 모두 관리할 수 있도록 구성한 것
      • 발생 이력
        • 시간에 따라서 발생하는 데이터를 모두 관리할 수 있도록 구성한 것
      • 진행 이력
        • 업무가 진행되는 상태를 모두 관리할 수 있도록 구성한 것
    • 이력 관리의 형태
      • 시점 이력 관리
        • 데이터의 변경이 발생한 시각만을 관리
      • 변경 이력 관리
        • 데이터 변경의 시작시점부터 그 상태의 종료시점까지를 진행 이력 데이터를 관리하는 식의 이력관리

    2016-2

    • meta data
      • 데이터에 관한 구조화된 데이터, 다른 데이터를 설명해주는 데이터
      • 메타데이터 구축을 위해서 다음과 같은 데이터 포맷을 사용한다.
        • MARC, machine readable cataloging
          • 코드화한 일련의 메타데이터
          • 목록레코드르르 상호교환하기위해 미국의회도서관이 개발
          • 즉 컴퓨터가 목록을 식별하여 축적/유통할 수 있도록 코드화한 일련의 메타데이터
        • DC
        • ONIX
        • MODS
    • data warehouse
      • 다량의 데이터를 효과적으로 분석하고 정보화하고 효율적으로 사용하도록 한 데이터베이스
      • 빠르고 정확한 의사결정 도와줌
    • OLAP, online analytical processing
      • 다차원으로 이뤄진 데이터로부터 통계적 요약정보 분석해 의사결정에 활용하는 방식
      • 이용자가 직접 컴퓨터 이용해 데이터접근에 있어 필수적 시스템
      • 데이터 웨어하우스를 다차원적으로 분석하고 시각화하는 시스템
      • 이용자가 직접 DB검색, 분석해서 문제점, 해결책을 찾는 분석형 애플리케이션 개념
    • OLAP의 종류
      • DOLAP (desktop)
        • 데이터를 pc로 내려받아 OLAP 수행
      • ROLAP
        • 관계형 데이터베이스와 SQL을 사용해 다차원 데이터를 저장 분석한다.
      • MOLAP
        • 다차원 데이터를 저장하기 위해 다차원 데이터베이스를 사용한다.
        • 다차원 DB 기반 OLAP아키텍처
      • HOLAP
        • ROLAP+MOLAP
    • data mining
      • 데이터웨어하우스에 저장된 데이터집합에서 요구에따라 유용한 정보발견 기법
      • 엄청난 데이터의 양을 유용한 정보로 가공하고자 하는 연구 중 한 분야

    2016-1

    • 관리기법/1 (2016-1)
      • 한국정보사회진흥원 주도로 번역되어 오랜기간 국가기관표준방법론으로 역해왔던 '관리기법/1'
    • 제약조건
      • DB에 저장되는 데이터의 정확성을 보장해주기 위해 키를 이용하여 입력되는 데이터에 제한을 주는 것
      • 삽삭갱 작업이 많이 동반되는 시스템의 경우 '제약조건'의 설정이 중요
    • 참조 무결성 제약조건을 유지하기 위한 3방법
      • cascade
      • restrict
      • set null
    • $ drop table 테이블명 cascade/restrict
      • cascade
        • 참조 테이블을 연쇄적으로 제거한다.
      • restrict
        • restrict는 제한하다, 금지하다, strict는 엄격하다는 뜻인데 재차(re)엄격하게 구니까 금지한거
        • 참조하는 테이블 있다면 제거안됨

    2015-3

    • DB의 정의
      • 통합 데이터, integrated data
        • 검색의 효율성을 위해 중복을 최소화한 데이터
      • 저장 데이터, stored data
        • 컴퓨터가 접근가능한 저장매체에 저장된 데이터
      • 운영 데이터, operational data
        • 조직 목표를 위해 존재가치 확실하고 반드시 필요한 데이터
      • 공유 데이터, shared data
        • 여러 프로그램들이 공동으로 사용하는 데이터
    • DB의 특징
      • 실시간 접근, real time accessibility
        • 사용자 쿼리에 즉시 처리하고 응답한다.
      • 계속 진화, continuos evolution
        • 항상 최근의 데이터를 동적으로 유지한다.
      • 동시 공유, concurrent sharing
        • 여러사용자가 동시에 원하는 데이터를 사용 가능하다.
      • 내용 기반 참조, content reference
        • 데이터를 참조할 때 내용으로 참조한다.
      • 독립성, independence
        • 논리적 독립성
          • app과 DB와의 관계 : 데이터의 논리적 구조를 변경하더라도 app에 영향 주지 않는다.
        • 물리적 독립성
          • app과 보조메모리와의 관계 : 새로운 저장장치의 추가에도 app에 영향 주지 않는다.
    • MARC, machine readable cataloging
      • 컴퓨터가 목록 데이터를 효율적으로 처리하도록 데이터를 컴퓨터가 인식할 수 있는 형식으로 변환시키고 정형화된 형식으로 배열해야한다.
      • MARC는 컴퓨터가 목록 데이터를 식별해 축적하고 유통할 수 있도록 코드화한 메타데이터의 표준 형식이다.
    • 상호 운용성, interoperability
      • 동일 기종, 타 기종 간 통신할 수 있고, 정보교환, 일련 처리를 정확하게 실행할 수 있는 것
    • MDR, metadata registry
      • 메타데이터의 등록과 인증을 통해 메타데이터를 유지, 관리한다.
      • 메타데이터의 명세를 공유하는 레지스트리
      • 메타데이터를 사용해 데이터 접근/사용을 촉진한다.

    2015-2

    • 튜닝
      • DB가 일정 성능을 유지할 수 있도록 비효율적 요소 제거하고 성능 개선위해 SQL 등 DB 의 여러 요소들을 조정/조율/최적화하는 작업이다.
    • locking
      • DB에서 동시성으로 인해 존재X데이터를 읽게되거나, 변경 데이터가 손실되는 등 부정적인 것을 방지위한 것.
      • 즉 하나의 트랜잭션이나 세션에 사용되는 데이터를 다른 트랜젝션이나 세션은 접근 못하게 하는 것.
    • 병행제어
      • 병행제어란?
        • 동시에 여러 개 수행시, DB 일관성 유지 위해 트랜잭션 간 상호작용을 제어하는 것
      • 병행제어 기법
        • locking
    • locking
      • 병행제어
      • locking이란?
        • 하나의 트랜젝션이 데이터액세스 하는동안, 다른 t이 그 데이터를 접근 할 수 없도록 하는 방법
      • locking단위
        • 로킹 단위 大 - lock 수 작다 - 관리 수월/병행성 수준down
        • 로킹 단위 小 - lock 수 크다 - 관리 복잡/병행성 수준up
    • selectivity
      • =선택도 =분포도 =선택성
      • 인덱스를 설계할 때에는 (selectivity)가 좋도록 설계해야한다.
      • 인덱스의 (selectivity)는 인텍스 키 값당 행의 개수를 기준으로 산정한다.
      • 분포도가 좋다 = 같은 키값을 가지는 튜플 수 적다 = 키 종류 다양하다
    • selectivity 내용 더 추가
      • 분포도가 좋다 = 해당 칼럼의 유니크한 데이터종류가 많다
      • 인덱스로 적정한 분포도는 10%~15% 정도
      • 분포도가 좋다 = 분포도 값이 낮으면서 데이터가 일정하게 분포돼있다.
      • 분포도가 좋은 것을 인덱스로 선택해야 한다.
    • 인덱스
      • 튜플에 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 데이터 구조
    • 인덱스 종류
      • 기본 인덱스
        • 기본키(PK)를 위한 인덱스
        • RDBMS에서는 모든 PK에 자동 기본 인덱스 생성
      • 보조 인덱스
        • 기본 인덱스 외 인덱스
      • 클러스터드 인덱스, clustered index
        • 인덱스 테이블 키 값 순서와 튜플 물리적 순서를 동일하게 유지하는 인덱스
        • (clustered)인덱스는 인덱스가 가리키는 데이터가 이미 정렬되어있어 최종 인덱싱 단계 없이 바로 데이터를 찾을 수 있다.
        • 속도 향상에 매우 도움 된다.
      • 넌-클러스터드 인덱스, non-clustered index
        • (clustered)인덱스보다 성능 떨어지나 한 테이블에 여러 개의 인덱스 설정이 가능하다
        • (non-clustered)인덱스는 한 특정값을 찾거나 많은 양 데이터 중 작은 범위를 찾을 때 유용하다.
    • 클러스터링
      • clustered index를 만들게되면 기본적으로 그 index key를 기준으로 물리적으로 데이터를 정렬(오름/내림차순)시켜 검색속도가 빨라진다.

    2015-1

    • 빅데이터
    • DSMS
      • data strem management system 데이터 스트림 관리 시스템
    • 이상, anomaly
      • 릴레이션 일부 속성들의 종속으로 인해 데이터 중복이 발생하고, 이런 중복으로 릴레이션 조작 시 문제가 발생하는 현상을 의미한다
    • 정규화 과정

    2014-3

    • 데이터 마트
      • 비교적 작은 규모의 데이터 웨어하우스
    • OLAP연산
      • 데이터를 변환시킬때 사용하는 연산
    • OLAP연산 종류
      • roll-up
        • 더 요약된 정보보기
      • drill-down
        • 더 구체적인 정보보기
      • drill-through
        • 데이터웨어하우스/OLTP에 존재하는 상세데이터제 접근하기
      • drill-across
        • 다른 데이터큐브의 데이터에 접근하기
      • pivoting
        • (회전문을 피벗팅 게이트라함)
        • 보고서의 행/열/페이지 차원을 바꾸보기
      • slicing
        • 다차원 데이터 항목을 다양한 각도에서 조회하고 자유비교 기능
      • dicing
        • (dice 주사위, dicing 주사위 놀이)
        • slicing을 더 쪼개는 형태
    • OLTP
      • on-line transaction processing
        • 주로 신용카드조회업무, 자동현금지급, 금융전산 부문에서 이용

    2014-2

    • 제약조건
      • 실제 데이터의 논리적인 제약조건
      • 릴레이션 인스턴스들이 만족해야하는 조건
    • 무결성 제약 조건
      • 무결성 제약조건은 DBMS가 무결성을 보장하기 위한 규칙.
    • 무결성 제약조건의 종류
      • 개체(entity) 무결성 제약조건
        • PK는 유일하고 not null이어야한다.
      • 참조(referential) 무결성 제약 조건
        • FK는 null 또는 참조 R에 있는 PK값이다.
    • mapping rule
      • ER model을 relationsip data model로 변환하는 규칙
    • 식별관계
      • 부모 엔티티의 주식별자(PK)가 자식 엔티티의 외래식별자(FK)이자 동시에 주식별자(PK)가 되는 관계
      • 식별관계는 실선으로 표시
    • 비식별관계
      • 부모 엔티티의 주식별자(PK)가 자식엔티티의 외래식별자(FK)이자 일반속성으로 전이
      • 비식별관계는 점선으로 표시

    2014-1

    • 2016-2

    2013-3

    • (본문읽기)
    • 빅데이터
    • 클라우드

    2013-2

    • 정규화 과정
    • 순수 관계 연산자
      • 셀렉트, select, σ
        • 조건을 만족하는 tuple 반환
        • e.g. 19금 이상만: σ나이>19(고객)
      • 프로젝트, project, π
        • 주어진 attribute의 값으로만 구성된 tuple 반환
        • e.g. 사는 곳은 궁금하지 않아: π이름,나이(고객)
      • 디비전, divison, ÷
      • 조인, join(2011-2),
        • 공통 attirbute를 이용해 r1과 r2의 tuple들을 연결해 만들어진 새로운 tuple 반환
      • 자연조인
        • 중복 속성값 제거하는 조인은 자연 조인

    2013-1

    • 정규화 과정
      • 함수 종속성
      • 다치 종속성

    2012-3

    • 정규화 과정
      • 부분 함수 종속
      • 이행 함수 종속

    2012-2

    • cascade
      • 부모r에서 수정이 발생하면 자식r의 FK값이 부모 릴레이션의 PK속성값으로 연쇄적으로 수정된다.
    • view
      • 가상 테이블
      • 물리적으로 존재하지 않으나 마치 테이블처럼 보임
      • 보안상, 조회용으로 이용한다.
    • 인덱스
      • 튜플에 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 데이터 구조
    • 인덱스 종류
      • 기본 인덱스
        • 기본키(PK)를 위한 인덱스
        • RDBMS에서는 모든 PK에 자동 기본 인덱스 생성
      • 보조 인덱스
        • 기본 인덱스 외 인덱스

    2012-1

    • data warehouse
      • 다량의 데이터를 효과적으로 분석하고 정보화하고 효율적으로 사용하도록 한 데이터베이스
      • 빠르고 정확한 의사결정 도와줌
    • 관계형 데이터베이스, RDB
      • 데이터를 열과 행으로 이뤄진 2차원의 릴레이션으로 표현하는 DB의 한 종류이다.
    • MOLAP
      • 다차원데이터를 저장하기위해 특수한 구조의 다차원DB를사용하고
      • 데이터검색속도 향상위해 주기억장치속에 데이터큐브를 보관하는 구조를 가진다.
    • ROLAP
      • 관계형 데이터베이스와 SQL을 사용해 다차원 데이터를 저장 분석한다.
    • HOLAP
      • ROLAP+MOLAP
    • 데이터큐브
      • 데이터가 여러차원으로 모델링 되는 것
      • 차원(dimension)과 사실(fact)로 정의된다.

    2011-3

    • 2016-3

    2011-2

    • 정규화 과정

    2011-1

    • 2015-3

    2010-4

    • subject area
      • 데이터 모델링 기법 중 하나, subject area
        • 관리하고자 하는 데이터그룹을 하위 'subject area'집합들로 분해하는 것
        • subject area는 데이터 세분화의 기초가 되고, 하향식으로 분석함으로써 계층적 표현 가능
    • data dictionary
      • DB시스템 내에서 관리된다.
      • DB에 저장되어있는 모든 데이터에 대한 정보를 유지, 관리한다.
      • 시스템 카탈로그 내에는 데이터에 관한 데이터라고 하여 메타데이터라고도 한다
      • DB시스템에 의해서만 액세스되고 갱신될 수 있다.
    • data dictionary(데이터 사전) = system catalog(시스템 카탈로그)
      • DBMS에서 사용되는 모든 파일, 속성, 변수의 목록
      • 나중에 사용자가 DB를 사용하거나, 프로그래밍할 때 DB 내 어떤 자료가 있는지, 그 자료가 어떻게 정의되어 있는지를 쉽게 알수 있다.
    • 시스템 카탈로그 = 데이터 사전
      • 시스템 자신이 필요로하는 여러가지 객체(테이블, 뷰, 인덱스, DB, 접근권한 등)에 대한 정보를 포함하고 있는 시스템 데이터베이스
    • full table scan
      • 릴레이션에 있는 모든 tupe들을 순차적으로 읽어내는 스캔 방법이다.
      • 분포도가 10%이하인 경우 '인덱스 스캔'이 효율적이지만,
      • 분포도가 10~15% 그 이상인 경우에는 'full table scan'이 효율적이다
    • RTRIM
      • sql에서 수행한 RTRIM은 문자열의 오른쪽 공백 제거 시 사용하는 함수이다.
      • LTRIM
        • 왼쪽 공백 제거
      • TRIM
        • LTRIM & RTRIM

    2010-2

    • 무결성
      • 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실세계의 실제 값이 일치하는 정확성을 의미한다
    • 정규화 과정

    2010-1

    • 정규화, normalization
      • '정규화' 간계가 진행될수록 중복감소, 갱신이상 감소로 무결성 제약조건을 시행하기 위해 필요한 코드 양도 줄어든다
      • 그러나 성능상의 관점에서만 보면 높은 '정규화'단계를 만족하는 릴스키마가 최적인것은 아니다.
    • 조인
      • 분해되기전의 릴레이션을 대상으로 질의를 할 때는 'join'이 필요없지만,
      • 분해된 릴레이션을 대상으로 질의할 때는 같은 정보를 얻기 위해 보다 많은 릴에 접근해야하므로 'join'의 필요성이 증가한다.
    • 비정규화, denomalization
      • 상황에따라 DB설계자는 응용의 요구사항에 따라 DB설계의 일부분을 'denormalization' 함으로써 데이터 중복/갱신 이상의 대가를 치루더라도 성능 상 요구를 만족시키기도 한다.
      • 'denomalizaiton'은 빈번 수행되는 검색질의들의 수행속도 높이기 위해 이미 분해된 두 개 이상의 릴들을 합쳐 하나의 릴로 만드는 작업이다
      • 'nomalization'된 데이터 모델을 통합하는 것이다.

    2009-4

    • 기본, 정규화 과정

    2009-2

    • 기본

    2009-1

    • 2016-1

    추가

    • transaction
      • 트랜잭션
        • DB에서 하나의 논리적 기능을 수행하기위한 연산집합. 작업의 논리적 단위
      • 트랜잭션 특징
        • ACID
          • 원자성, atomicity
          • 일관성, consistency
          • 독립성, isolation
          • 영속성, durability


Designed by Tistory.