집에서 하는 공부/정보처리기사

[정보처리기사]데이터베이스 기초 활용하기

집돌이 공대남 2022. 6. 3. 10:32
반응형

1. 데이터베이스(Database)

-개념

다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리 되는 데이터의 집합

 

- 정의

*통합된 데이터

자료의 중복을 배제한 데이터의 모임

*저장된 데이터

저장 매체에 저장된 데이터

*운영 데이터

조직의 업무를 수행하는 데 필요한 데이터

*공용 데이터

여러 어플리케이션, 시스템들이 공동으로 사용하는 데이터

 

- 특성

*실시간 접근성

쿼리에 대하여 실시간 응답이 가능해야 함

*계속적인 변화

새로운 데이터의 삽입, 삭제 갱신으로 항상 최신의 데이터를 유지

*동시공용

다수의 사용자가 동시에 같은 내용의 데이터를 이용할 수 있어야 함

*내용참조

사용자가 요구하는 데이터 내용으로 데이터를 찾음

 

- 종류

*파일 시스템(File System)

파일에 이름을 부여하고 저장이나 검색을 위해 논리적으로 그것들을 어디에 위치시켜야 하는지 등을 정의한 뒤 관리하는 데이터 베이스 전 단계의 데이터 관리 방식

*관계형 데이터베이스 시스템(RDBMS)

관계형 모델을 기반

 **종류: Oracle, SQL Server, My SQL, Maria DB 등

*계층형 데이터베이스 시스템(HDBMS)

데이터를 상하 종속적인 관계로 계층화 하여 관리

 **종류: IMS, System2000 등

*네트워크 데이터베이스 관리시스템(NDBMS)

데이터를 네트워크상의 망상 형태로 표현한 데이터 모델

 **종류: IDS, IDMS 등

 

2. DBMS(Database Management System)

-개념

데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어

 

- 특징

무결성, 일관성, 회복성, 보안성, 효율성

 

- 유형

*키-값(Key-Value) DBMS

Unique 한 키에 하나의 값을 가지고 있는 형태

*컬럼 기반 데이터 저장(Column Family Data Store) DBMS

Key안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS

*문서 저장(Document Store) DBMS

값(Value)의 데이터 타입이 문서(Document)라는 타입을 사용하는 DBMS

*그래프(Graph) DBMS

시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS

 

3. 빅 데이터(Big Data)

-개념

시스템, 서비스, 조직(회사) 등에서 주어진 비용, 시간 내에 처리 가능한 수십 페타바이트(PB) 크기의 비정형 데이터

 

- 특성

데이터의 양, 데이터의 다양성, 데이터의 속도

 

- 빅데이터 수집, 저장, 처리기술

*비정형/반정형 데이터 수집

내/외부 정제되지 않은 데이터를 확보하여 수집 및 전송하는 기술

*정형 데이터 수집

내/외부 정제된 대용량 데이터의 수집 및 전송 기술

*분산데이터 저장/처리

대용량 파일의 효과적인 부산 저장 및 분산 처리 기술

*분산데이터 베이스

HDFS 칼럼 기반 데이터베이스로 실시간 랜덤 조회 및 업데이트 가능

 **HDFS

  대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산   파일 시스템

 

4. NoSQL(Not Only SQL)

-개념

데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS

 

- 특성

*Basically Available

언제든지 데이터 접근 할 수 있는 속성

*Soft-State

외부에서 전송된 정보를 통해 결정되는 속성

*Eventually Consistency

이관성이 유지되는 속성

 

- 유형

* Key-Value Store

Unique 한 키에 하나의 값을 가지고 있는 형태

* Column Family Data Store

Key안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DB

* Document Store

값(Value)의 데이터 타입이 문서(Document)라는 타입을 사용하는 DB

* Graph DBMS

시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS

 **시멘틱 웹

온톨로지를 활용하여 서비스를 기술하고, 온톨로지의 의미적 상호 운용성을    이용해서 서비스 검색, 조합, 중재 기능을 자동화하는 웹

 **온톨로지

실세계에 존재하는 모든 개념들과 개념들의 속성, 그리고 개념들간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식 베이스


5. 데이터 마이닝(Data Mining)

-개념

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

 

- 절차

목적 설정 -> 데이터 준비 -> 가공 -> 마이닝 기법 적용 -> 정보 검증

 

- 유형

*분류 규칙

과거 데이터를 토대로 새로운 레코드의 결과 값을 예측하는 기법

*연관 규칙

데이터 안에 항목들 간의 종속 관계를 찾아내는 기법

*연속 규칙

연관 규칙에 시간 관련 정보가 포함된 형태의 기법

*데이터 군집화

대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업


데이터베이스에 대한것이 요즘 출제 빈도가 높다.

특히 빅데이터에 대한 관심이 높아지면서 해당 내용 출제 빈도가 높으니 확실히 파악하길 바란다.

 

오늘도 화이팅!

반응형