데이터베이스 (DataBase, DB)

데이터베이스 (DataBase, DB)

데이터베이스 (DataBase, DB)는 여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합이다. 작성된 목록으로써 여러 응용 시스템들의 통합된 정보를 저장하여 운영할 수 있는 공용 데이터들의 묶음이다. 데이터베이스에 속해있는 모델은 다양하다.

- 역사

1950년대에 데이터베이스라는 용어가 미국에서 처음 사용되었으며, 본래는 군비의 집중적, 효율적 관리를 위해 컴퓨터를 활용한 도서관 개념을 개발하면서 이를 '데이터의 기지'라는 뜻의 데이터베이스로 일컬었다. 이후 1965년 시스템 디벨로프사가 2차로 개최한 '컴퓨터의 중심 데이터베이스 시스템'이라는 심포지엄에서 처음 사용하였다.

프로세서, 컴퓨터 메모리, 컴퓨터 스토리지, 컴퓨터 네트워크 분야에서 기술이 진전됨에 따라 등급 순으로 데이터베이스 및 각 DBMS의 크기, 성능, 기능이 상승해왔다. 데이터베이스 기술의 발전은 데이터 모델이나 구조에 따라 세 개의 시대로 나뉜다 (내비게이셔널 데이터베이스, SQL/관계형 데이터베이스, 관계형 이후 데이터베이스)

주가 되는 2개의 네비게이셔널 데이터 모델은 IBM의 IMS 시스템의 전형적 본보기가 되는 계층형 모델 그리고 IDMS와 같은 수많은 제품들에 구현된 CODASYL 모델 (네트워크 모델)이다.

1970년에 에드거 F. 커드가 처음 제안한 관계형 모델은 응용 프로그램들이 뒤따르는 링크가 아닌 내용을 기준으로 데이터를 검색해야 한다고 주장하면서 이러한 전통에서 출발하였다. 관계형 데이터 모델은 금전출납부 스타일의 표들의 모임을 이용하며, 각각은 다른 타입의 엔티티를 위해서 사용된다.

1980년대 들어서야 컴퓨팅 하드웨어가 비로소 관계형 시스템 ( DBMS + 애플리케이션)의 폭넓은 배치를 가능케 할 만큼 강력해졌다.

그러나 1990년대 초에 들어서 모든 대형 데이터 처리 애플리케이션을 관계형 시스템이 지배하게 되었으며 2015년 기준으로 여전히 상황은 동일하다. IBM DB2, 오라클, MySQL, 마이크로소프트 SQL 서버 (MSSQL)는 최상위 DBMS이다. 지배적인 데이터베이스 언어, 곧 관계형 모델을 위한 표준화된 SQL은 다른 데이터 모델의 데이터 베이스 언어들에 영향을 미쳤다. 객체지향 데이터베이스는 객체 지향 임피던스 불일치의 불편함을 극복하고자 1980년대에 개발되었으며, 이로 인해 "관계형 이후" (Post-Relational)라는 용어가 만들어졌고 하이브리도 객체 관계 데이터베이스의 개발로도 이루어졌다.

2000년대 말에 관계형 이후 차세대 데이터베이스는 NoSQL 데이터베이스로 알려지게 되었으며 고속의 키-값 스토어, 도큐먼트 지향 데이터베이스를 도입하였다. NewSQL 데이터베이스라는 경쟁력있는 차세대 데이터베이스는 상용 관계형 DBMS 대비 NoSQL의 높은 성능에 부합하면서 관계형/SQL 모델을 보유하는 새로운 구현을 시도하였다.

데이터베이스의 개념

여러사람이 공유하고 사용할 목적으로 통합 관리되는 정보의 집합이다. 논리적으로 연관된 하나 이상의 자료의 모음으로 그 내용을 고도로 구조화함으로써 검색과 갱신의 효율화를 꾀한 것이다. 즉 몇 개의 재료 파일을 조직적으로 통합하여 자료 항목의 중복을 없애고 자료를 구조화하여 기억시켜 놓은 자료의 집합체라고 할 수 있다.

공동 자료로써 각 사용자는 같은 데이터라 할지라도 각자의 응용 목적에 따라 다르게 사용할 수 있다.

- 데이터베이스의 특징

실시간 접근성
지속적인 변화
동시 공유
내용에 대한 참조
데이터 논리적 독립성

- 데이터베이스의 장단점

> 데이터베이스의 장점

데이터 중복의 최소화
데이터 공유
일관성, 무결성, 보안성 유지
최신의 데이터 유지
데이터의 표준화 가능
데이터의 논리적, 물리적 독립성
용이한 데이터 접근
데이터 저장 공간 절약

> 데이터베이스의 단점

데이터베이스 전문가 필요
많은 비용 부담
데이터 백업과 복구가 어려움
시스템의 복잡함
대용량 디스크로 엑세스가 집중되면 과부하 발생

데이터베이스의 트랜잭션

트랜잭션은 하나의 논리적 단위를 구성하는 데이터베이스 연산의 모임이다. 동시에 여러 트랜잭션이 수행되기 위해서 데이터베이스의 일관성이 보장되어야 하며 이를 위해 동시성 제어 (Concurrency Control)와 회복 제어 (Recovery Control)를 위한 모듈이 있으며 이 둘을 합쳐 트랜잭션 관리 모듈 (Transaction Management Module)이라고 한다.

- 동시성제어 모듈 (Concurrency Control Module)

데이터베이스를 일관성 있게 유지하기 위하여 동시에 수행되는 트랜잭션들 사이의 상호작용을 제어한다.

- 회복제어 모듈 (Recovery Control Module)

데이터베이스를 일관성 있게 유지하기 위하여 업데이트를 하는 동안 시스템 장애에도 데이터베이스의 기존 상태가 유지된다.

트랜잭션의 스케줄링은 다음과 같은 3가지 개념을 가진다.

- 직렬 스케줄링 (Serial Scheduling)

트랜잭션 연산자들을 각 트랜잭션 별로 연속적으로 실행하는 방법

- 비직렬 스케줄링 (Nonserial Scheduling)

트랜잭션 연산자들을 상호적 (Interleaving)으로 병행 실행하는 방법

- 직렬 가능 스케줄링 (Serializable Scheduling)

비 직렬 스케줄링 S가 항상 직렬 스케줄링 SS에 대해서 같은 결과를 가질 때 "S를 직렬 가능"하다고 한다.

저작자표시 (새창열림)

'IT' 카테고리의 다른 글

스크럼 (Scrum, 애자일 개발 프로세스) (0)	2022.09.27
파일 시스템 (File System) (0)	2022.09.26
인공지능 (Artificial Intelligence, AI) (1)	2022.09.24
도커 (Docker) 소프트웨어 (0)	2022.09.23
가상 현실 (Virtual Reality, VR) (0)	2022.09.22

돈이 되는 정보와 세상의 이슈

데이터베이스 (DataBase, DB)