ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • DB 와 SQL 공부를 시작하며 - DB와 엑셀 비교
    데이터 분석/DB & SQL 2019. 5. 5. 11:42

    데이터베이스 DB : 테이블 그리고 테이블과 관련된 SQL 구성요소들을 담고 있는 저장소

    주로 RDBMS Relational DataBase Management System 이 사용되지만, 최근에는 NoSQL 도 많이 사용되는듯. NoSQL 이 비정형화 데이터를 쭈욱- 나열해서, RDB 사용할 때의 복잡한 데이터 구조와 JOIN 쿼리 실행을 안해도 된다는 장점이 있다고 한다.

    쭈욱 나열된 걸 사용자가 정리해서 봐야하는게 더 스트레스일 것 같기는 한데. 아직 NoSQL 을 경험해보지 않아서 잘 체감이 안된다. 

     

    테이블 Table : 열과 행으로 구조화하여 보관하고 있는 데이터베이스의 구성요소

    엑셀파일은 데이터베이스, 테이블은 엑셀의 스프레드시트와 유사하다. 엑셀 신들은 생각보다 많은 것들을 하신다. 가만히 들여다보면, DB 와 원리가 똑같다.  두 시트가 공유하는 식별자로 마치 JOIN 한 것 처럼 VLOOKUP 해서 하나의 결과시트로 만들기도 하고, 연결된 데이터에 대해 피벗테이블로 집계 Aggregate 하기도 한다.  

    회사에서도 개발자들이 기획자가 엑셀 쓰는 것을 보면 감탄하기도 한다. 엑.셀.신.공.

     

    열 Column / Field : 테이블에 저장된 하나의 데이터, 카테고리의 이름

    행 Row한 객체에 대한 속성들을 나타내는 열 집합

    값 Record : 특정 열의 특정 값 

    데이터타입 Datatype : 데이터의 타입을 정의

    가끔 엑셀에서도 똑같은 숫자끼리도 연산이 적용되지 않는 경우가 있다. 이 것은 99.9% 해당 레코드의 데이터타입 문제이다. 사람이 보기에는 같은 데이터도, 데이터타입이 다르면 컴퓨터는 다른 데이터로 인식한다. 엑셀이 파일을 불러올 때, 임의로 데이터타입을 정의하곤 하는데, 가끔은 이걸 바꿔주는 게 필요하다. 사실 맥 엑셀 소프트웨어에서는 데이터타입 변환이 잘 안된다. 애초에 csv 파일을 불러올 때 import, 각 필드 단위로, 특히 식별자나 연산 대상이 될 필드에 대해 데이터타입을 재정의하는 것이 좋다.

     

    쿼리 Query : 질의한다.

    데이터를 저장하고, 조작하고, 검색할 때 사용하는 언어이다. SQL 은 RDBMS 에 따라 조금씩 다를 수는 있지만, 기본은 비슷하다. 엑셀에는 많은 기능 (필터링, 중복제거 등) 과 함수 (COUNT, SUM, VLOOKUP 등) 이 있고, SQL 에는 키워드 Keyword 가 있다. 버튼과 함수 대신에 키워드를 사용한다고 생각해보자.

    우선 기본 키워드 SELECT, GROUP BY, ORDER BY 등을 익히고, 원하는 키워드를 점차 확장해나가면 된다. 어차피 SQL 을 실행했을 때, 쿼리에 문제가 있을 경우 빨간 에러로그가 발생한다. 쿼리실행하는데 너무 오래 걸리면 중지시키자. (사내 DBA 한테 불려가기 전에)

    SQL 키워드 공부: https://www.w3schools.com/sql/default.asp

     

    일반적인 DB 관리 시스템 DBMS 의 구조 - 이제 쿼리를 짜기 시작한 나에게는 너무나 먼 당신

     

    댓글

Designed by Tistory.