-
[data.world] query template 과 형변환 처리데이터 분석/DB & SQL 2020. 4. 20. 00:11
SQL tutorial excersize data Data was genererated using Synthea, a synthetic patient generator that models the medical history of synthetic patients. (...)De-identified real data still presents a challenge in the medical field because there are peopel who excel at re-identification of these data. 예시로 사용할 dataset 은 data.world 의 사용법을 익히라고 제공된 연습 데이터입니다. 하지만 완전 더미 데이터가 아니고 실제 미국의 합병증 환자에 대한 의료기록입니다...
-
[data.world] 비개발 직군을 위한 데이터 솔루션데이터 분석/DB & SQL 2020. 4. 18. 11:07
는 dataset 을 웹에 올려서 쿼리할 수 있고, 쿼리 및 쿼리결과를 손쉽게 공유할 수 있는 툴이다. 비즈니스의 모든 직군이 데이터를 활용할 수 있도록 지원한다. 특장점은 아래 3개이다. 장점 1. 접근성 가 제공하는 기능은 Zeppelin 또는 Jupyter 와 유사하나, 웹 기반이어서 접근성이 뛰어나다. 특히 비개발 직군 유저들이 VDI 접속 없이 데이터를 만져보도록 환경을 구성할 수 있다. 쿼리결과 파일 다운로드는 물론이고, 다양한 데이터 관련 솔루션로 데이터를 연동시킬 수 있다. - 마케터: Google Data Studio, Excel - 기획자(Product Manager): Jupyter, Tableau - 데이터 분석가: SPSS, R, Algorithmia 장점 2. 리스크 감소 DB ..
-
SELECT 쿼리의 좋은 습관데이터 분석/DB & SQL 2019. 5. 5. 12:54
쿼리의 대부분은 SELECT 조회 쿼리이다. 요새는 기획자들도 Hue 를 통해 DB 에 접근하고 SELECT 쿼리를 실행하기도 한다. 나 같은 초심자를 위해 SELECT 쿼리를 작성할 때의 좋은 습관과 주의사항을 정리해보았다. SELECT 문을 위한 좋은 습관 - 쿼리문에 따라 성능이 좌지우지 된다. 쿼리문에 따라 성능이 좌지우지 된다. 심지어 아주 가끔은 잘못 쓰면 DB가 사망하는 경우가 가끔 있다. --- 위보다는 아래처럼 SELECT * FROM easy_drinks; SELECT drink_name, main, second FROM easy_drinks; --- 전체 필드를 보고 싶다면, 행을 줄여서 SELECT * FROM easy_drinks limit 10; --- WHERE 조건은 다음 라..
-
DB 와 SQL 공부를 시작하며 - DB와 엑셀 비교데이터 분석/DB & SQL 2019. 5. 5. 11:42
데이터베이스 DB : 테이블 그리고 테이블과 관련된 SQL 구성요소들을 담고 있는 저장소 주로 RDBMS Relational DataBase Management System 이 사용되지만, 최근에는 NoSQL 도 많이 사용되는듯. NoSQL 이 비정형화 데이터를 쭈욱- 나열해서, RDB 사용할 때의 복잡한 데이터 구조와 JOIN 쿼리 실행을 안해도 된다는 장점이 있다고 한다. 쭈욱 나열된 걸 사용자가 정리해서 봐야하는게 더 스트레스일 것 같기는 한데. 아직 NoSQL 을 경험해보지 않아서 잘 체감이 안된다. 테이블 Table : 열과 행으로 구조화하여 보관하고 있는 데이터베이스의 구성요소 엑셀파일은 데이터베이스, 테이블은 엑셀의 스프레드시트와 유사하다. 엑셀 신들은 생각보다 많은 것들을 하신다. 가만히 ..