-
DB 와 SQL 공부를 시작하며 - DB와 엑셀 비교데이터 분석/DB & SQL 2019. 5. 5. 11:42
데이터베이스 DB : 테이블 그리고 테이블과 관련된 SQL 구성요소들을 담고 있는 저장소
주로 RDBMS Relational DataBase Management System 이 사용되지만, 최근에는 NoSQL 도 많이 사용되는듯. NoSQL 이 비정형화 데이터를 쭈욱- 나열해서, RDB 사용할 때의 복잡한 데이터 구조와 JOIN 쿼리 실행을 안해도 된다는 장점이 있다고 한다.
쭈욱 나열된 걸 사용자가 정리해서 봐야하는게 더 스트레스일 것 같기는 한데. 아직 NoSQL 을 경험해보지 않아서 잘 체감이 안된다.
테이블 Table : 열과 행으로 구조화하여 보관하고 있는 데이터베이스의 구성요소
엑셀파일은 데이터베이스, 테이블은 엑셀의 스프레드시트와 유사하다. 엑셀 신들은 생각보다 많은 것들을 하신다. 가만히 들여다보면, DB 와 원리가 똑같다. 두 시트가 공유하는 식별자로 마치 JOIN 한 것 처럼 VLOOKUP 해서 하나의 결과시트로 만들기도 하고, 연결된 데이터에 대해 피벗테이블로 집계 Aggregate 하기도 한다.
회사에서도 개발자들이 기획자가 엑셀 쓰는 것을 보면 감탄하기도 한다. 엑.셀.신.공.
열 Column / Field : 테이블에 저장된 하나의 데이터, 카테고리의 이름
행 Row : 한 객체에 대한 속성들을 나타내는 열 집합
값 Record : 특정 열의 특정 값
데이터타입 Datatype : 데이터의 타입을 정의
가끔 엑셀에서도 똑같은 숫자끼리도 연산이 적용되지 않는 경우가 있다. 이 것은 99.9% 해당 레코드의 데이터타입 문제이다. 사람이 보기에는 같은 데이터도, 데이터타입이 다르면 컴퓨터는 다른 데이터로 인식한다. 엑셀이 파일을 불러올 때, 임의로 데이터타입을 정의하곤 하는데, 가끔은 이걸 바꿔주는 게 필요하다. 사실 맥 엑셀 소프트웨어에서는 데이터타입 변환이 잘 안된다. 애초에 csv 파일을 불러올 때 import, 각 필드 단위로, 특히 식별자나 연산 대상이 될 필드에 대해 데이터타입을 재정의하는 것이 좋다.
쿼리 Query : 질의한다.
데이터를 저장하고, 조작하고, 검색할 때 사용하는 언어이다. SQL 은 RDBMS 에 따라 조금씩 다를 수는 있지만, 기본은 비슷하다. 엑셀에는 많은 기능 (필터링, 중복제거 등) 과 함수 (COUNT, SUM, VLOOKUP 등) 이 있고, SQL 에는 키워드 Keyword 가 있다. 버튼과 함수 대신에 키워드를 사용한다고 생각해보자.
우선 기본 키워드 SELECT, GROUP BY, ORDER BY 등을 익히고, 원하는 키워드를 점차 확장해나가면 된다. 어차피 SQL 을 실행했을 때, 쿼리에 문제가 있을 경우 빨간 에러로그가 발생한다. 쿼리실행하는데 너무 오래 걸리면 중지시키자. (사내 DBA 한테 불려가기 전에)
SQL 키워드 공부: https://www.w3schools.com/sql/default.asp
'데이터 분석 > DB & SQL' 카테고리의 다른 글
[data.world] 비개발 직군을 위한 데이터 솔루션 (0) 2020.04.18 HackerRank Mysql 문제풀이 - Binary Tree Nodes (0) 2019.12.15 hackerrank mysql Occupations 문제풀이 (0) 2019.12.15 서브쿼리 Sub Query - 상관쿼리와 비상관쿼리 (0) 2019.05.12 SELECT 쿼리의 좋은 습관 (0) 2019.05.05