본문 바로가기

별걸다하는 IT/데이터베이스 Database

[데이터베이스]DB vs DBMS? 데이터(raw data)vs정보(information)정의 및 차이점? cooked data?

데이터베이스(DB, DBMS) 목차


안녕하세요~~ 

이번 포스팅은 

데이터베이스의 문을 여는 첫 시작글이 되겠습니다. 

데이터베이스를 배우기 앞서 데이터베이스란 단어에 데이터가 있는데, 데이터가 뭔지 모르면 아니되겠죠?


데이터란? 데이터와 정보

우리가 살고 있는 시대는 4차 산업혁명의 시대라고들 하죠. 오늘날은~~ 바로 정보화시대예요.

그런데 데이터와 정보를 같은 것으로 헷갈리는 사람들이 많답니다. 정보화시대인대 정보가 뭔지 모르면 안되겠죠!

정보랑 데이터는 엄연히 다른 개념이예요. 데이터를 관리하는 데이터베이스에 들어가기 앞서 데이터와 정보의 차이를 명확하게 정리하고 갑시다.


데이터(data)는 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실(fact)이나 값(value)로, 자료라고 합니다.

정보(information)는 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물이예요.

정보처리(information processing): 데이터에서 정보를 추출하는 과정 또는 방법을 말합니다. 즉 정보처리는 데이터를 상황에 맞게 분석하거나 해석하여 데이터간의 의미 관계를 파악하는 것이죠 (빅데이터시대가 되면서 정보처리 기술은 매우 중요해졌어요)



example

한 예로, 예전에 귀찮게 자꾸 자동으로 깔려서 한 번 빡쳤던 적이 있는 11번가 사이트를 예시로 들어봅시다 (그래놓고 또 이용하고 있다는.. 홍보아님)


이런 사이트만 봐도 데이터들은 엄청 많아요

회원 이름,, 회원 주소, 회원 나이, 회원 전번 등등 부터 시작해서 팔려고 하는 상품의 이름, 가격, 할인율, 배송비, 품목..

쿠폰, 고객센터의 공지사항, 사람들이 올린 문의글, 또 홈페이지에는 없지만 내가 로그인하면 로그인 된 시각, 날짜 등등 

아 셀수가 없고 너무많아서 생각하기도 힘들어요.

근데 11번가에 이런 구매관련 데이터만 있을까요?! NO! 11번가 직원, 부서, 업무 관련 .. 더욱 더 방대해지는 데이터..

볼 수 있는 데이터부터 볼 수 없는 데이터까지 이게 모두 다 그냥 데이터죠! 자료예요. 11번가는 이렇게 많은 데이터들을 수집하고 저장하고 있죠. 이렇게 뭔가 가공되지 않고 쭈우우우욱 사용되는 데이터를 raw data라고 합니다.


또 다른 정의 표현~ (어차피 같은 말이지만ㅎ) 

- 데이터는 컴퓨터 디스크와 같은 매체에 저장된 사실을 말하고 정보는 데이터를 처리해서 사람이 이해하기 적합한 형태로 의미있게 만든 것


Raw data(sometimes called source data or atomic data) is data that has not bee processed for us.

Raw data = source data 원천데이터 = atomic data = data = 데이터 = 자료

다 같은 말이예요. 수집되는 데이터 그 자체를 말합니다.


A distinction is sometimes made between data and information to the effect that information is the end product of data processing. Raw data that has undergone processing is sometimes refereed to as cooked data. 

아까 제가 앞에서 말했던, 정보는 데이터 처리가 다 끝난 말그대로 마지막 산물입니다. 그러면 데이터 처리 중인 애는? cooked data라고 불러요. 

Although raw data has the potential to become "information", it requires selective extraction, organization, and sometimes analysis and formatting for presentation. 

데이터를 기반으로 우리가 알고 싶은 정보를 만들기 위해서는, 관련 데이터들을 추출하고, 구성하고 분석하고 형성하면서 만들어지는 거예요.


11번가에서 하루에 팔리는 상품이 엄청 많을텐데 팔릴때마다 매번 그 데이터를 산출하지는 않죠. 나중에 하루가 끝나기 직전 관련 데이터들만 쭈우욱 모아가지고 수입이 얼마나 되는지 정산 즉 계산할거예요. 그렇게 오늘 얼마나 벌었나? 알려주는 정보(가공 처리가 된거죠?)가 되기 전에 처리중인 데이터는 cooked data라고 부릅니다.


또 11번가에 보면 11번가 BEST! 가 있는데 

이 또한 가장 잘팔리는 상품이 무엇인지 best 상품 정보를 생성하기 위해, 

사람들이 얼마나 클릭했는지, 얼마나 구매했는지 등을 분석하고 이러한 정보가 앞으로 미래에 best상품이 될 것 같은, 인기상품을 예측하는 데이터로 사용될 수 있겠죠!


이렇게 온라인 사이트 외에도

옷가게나 음식점에 가면 키오스크 또는 포스기 등을 볼 수 있어요 

이런거!! 포스기는 데이터들을 모아서 하루 매출, 수입, 영업이익 등을 정보를 얻을 수 있도록 처리해주죠

판매량을 통해 잘 안나가는 음식은 무엇인지 정보를 얻을 수 있겠죠?

가격이 낮아서 그런건지, 질이 안좋아서 그런건지, 해결책을 얻고자 설문지나 만족도를 돌릴 수 있어요

이렇게 사람들로부터 얻은 결과지도 데이터입니다. 설문지 데이터를 통해 아 70퍼센트의 사람들이 비싼 가격이 부담된다고 했구나 추출하면 이건 내가 얻고자 하는 정보가 되는거예요ㅎ 


DB란? 데이터베이스란? 

그런데 .. 이렇게 많은 데이터들을 어떻게 관리할까요? 정보를 추출하기 위해서는 일단 어딘가에 저장이 되어있어야 할거 아니예요. 

데이터들을 저장한 파일들의 집합체를 데이터베이스라 하고 

데이터들을 관리하는 시스템을 제공해주는 소프트웨어를 DBMS라 하고 합니다. DBMS는 database management system의 약자예요. 데이터베이스가 필요한 전형적인 환경을 일단 데이터의 양이 방대하죠..ㅎ

데이터베이스가 없었던 시절에는 파일로 데이터들을 정리했어요.

우리가 노트북에서 쓰는 데이터들은 사실 양이 그렇게 많지 않기 때문에, 이렇게 저장하는데 


이게 파일 시스템입니다.


DB vs DBMS

데이터베이스는 정보시스템 및 기업의 비즈니스를 수행하기 위해서 필요한 각종 데이터를 일정한 규칙으로 저장하여 관리하는 것으로 공동의 목적으로 데이터를 사용하기 위한 집합체이며 논리적으로 연관된 레코드나 파일의 모임입니다.

데이터베이스 관리 시스템(DBMS)는 말 그래도 이러한 데이터베이스를 관리하기 위한 소프트웨어 즉 시스템입니다. 

따라서 대표적 DBMS인 오라클이나 MySQL과 같은 제품을 DBMS이며 데이터베이스가 아닙니다.

우리는 데이터베이스를 이해하고 DBMS를 사용하는 방법에 대해서 앞으로 차차 배워볼거예요.


데이터베이스는 정말 우리주변 대부분에서 사용되고 있어요

컴퓨터화된 도서관 시스템, 기업에서의 사원 및 프로젝트 관리, 병원에서의 환자 관리, 은행에서의 고객 관리 등 데이터베이스가 사용되는 사례는 너무 많아서 언급자체가 의미없습니다. ㅎ


그럼 이전에 사용되던 파일 시스템의 문제가 뭐였기에 데이터베이스가 등장하게 된걸까요?

파일시스템의 문제점과 그러인해 나타난 데이터베이스의 흐름

파일시스템과 데이터베이스의 차이에 대해서 다음 포스팅에 알아볼게요


도움이 됐다면 공감댓글~!