본문 바로가기

Data science

[ADP/ADsP] 데이터베이스 (DataBase)

데이터베이스 정의와 특징

 

1. 용어와 연혁

1) 1950년대 미국 정부가 전 세계에 산재한 자국 군대의 군비상황을 집중관리하기 위하여 컴퓨터 기술로 구현한 도서관을 설립하면서 비롯되었다. 이때 수집된 자료를 일컫는데이터(Data)의 기지(Base)’라는 뜻으로데이터베이스(Database)’가 탄생되었다.

 

2) 1963년대 데이터 베이스라는 용어과 공식적으로 사용된 곳은 미국SDC(System Development Corporation)가 개최한컴퓨터 중심의 데이터베이스 개발과 관리라는 주제의 심포지엄이었고, 대량의 데이터를 축적하는 기지라는 초기단계의 의미에 머물렀다.

GE(General Electronic) C.바크만은 최초의 현대적 의미의 데이터베이스 관리 시스템인 IDS(Integrated Data Store)를 개발하였다.

 

3) 1970년대 초반 유럽에서데이터베이스(Database)’라는 단일어가 일반화되었고, 후반에는 미국 주요 신문 등에서 흔히 사용하게 되었다.

우리나라에서는 1975년 미국의 CAC(Chemical Abstracts Condensates) KORSTIC(한국과학기술정보센터)을 통해 서비스되면서 데이터베이스이용이 이루어졌다.

 

2. 데이터베이스의 정의

1)  데이터베이스(Database) : 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보처리 및 정보통신 기기에 의하여 체계적으로 수집, 축척하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체이다.

     * 콘텐츠란 다양한 의미전달 매체에 의하여 표현된 데이터, 정보, 지식, 저작물 등의 인식 가능한 모든 자료를 의미 한다.

2) DBMS(Database Management System) : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어 이다.

     * 데이터베이스시스템(DB System)는 데이터베이스, DBMS를 모두 칭함.

 

3. 데이터베이스의 특징

  단순한 저장소의 개념 →  첨단 정보기술을 바탕으로 원하는 데이터를 저장, 검색할 수 있는 복합체의 개념 

   - 초기 : 있는 그대로의 데이터를 저장하는 장치 (일반적인 텍스트나 숫자, 그래프형태)

   - 현재 : ‘정보를 저장하는 지식베이스(이미지, 동영상 등을 포함)

 

1) 데이터베이스는 통합된 데이터이다. (Integrated data)

    - 동일한 내용의 데이터가 중복되어 있지 않다.

    - 데이터의 중복은 일반적으로 관리상의 복잡한 부작용을 초래한다.

2) 데이터베이스는 저장된 데이터이다 (Stored data)

    - 자기 디스크. 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장된다.

    - 데이터베이스는 기본적으로 컴퓨터기술을 바탕으로 한 것이다.

3) 데이터베이스는 공용데이터이다. (Shared data)

    - 여러 사람이 동시에 데이터를 사용하고자 하는 목적을 가능하게 한다. (ex. 동시성의 해결)

    - 여러 사용자가 서로 다른 목적으로 DB의 데이터를 공동으로 이용하는 것을 의미한다.

   - 일반적으로 대용량화되고 구조가 복잡한 것이 특징이다.

4) 데이터베이스는 변화하는 데이터이다.

   - DB가 저장하는 내용은 곧 데이터베이스의 한 상태를 나타낸다

   - 그러나, 이 상태는 기존의 데이터의 삭제, 새로운 데이터의 삽입, 갱신으로 항상 변화하면서도

     현재의 정확한 데이터를 유지해야 한다.

 

4. 데이터베이스의 다양한 측면에서의 특성

1) 정보의 축적 및 전달 측면

    대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 일고 쓸 수 있도록 하는 기계가독성과 다양한 방법으로 필요한 정보를 검색할 수 있는 검색가능성, 그리고 정보통신망을 통하여 원거리에서도 즉시 온라인으로 이용할 수 있는 원격조작성을 갖는다.

 

2) 정보 이용 측면

   이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득할 수 있고 원하는 정보를 정확하고 경제적으로 찾아낼 수 있다는 특성을 지닌다.

 

3) 정보 관리 측면

   정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이하다.

 

4) 정보기술 발전의 측면

   데이터베이스는 정보처리, 검색, 관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술등의 발전을 견인할 수 있다.

 

5) 경제, 산업적 측면

   데이터베이스는 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라로서 특성을 가지고 있어 경제, 산업, 사회활동의 효율성을 제고하고 국민의 편의를 증진하는 수단으로서 의미를 갖는다.

'Data science' 카테고리의 다른 글

[ADP/ADsP] 데이터베이스의 활용  (0) 2022.12.19
[ADP/ADsP] 데이터의 이해  (0) 2022.12.15