-
[data.world] 비개발 직군을 위한 데이터 솔루션데이터 분석/DB & SQL 2020. 4. 18. 11:07
는 dataset 을 웹에 올려서 쿼리할 수 있고, 쿼리 및 쿼리결과를 손쉽게 공유할 수 있는 툴이다. 비즈니스의 모든 직군이 데이터를 활용할 수 있도록 지원한다. 특장점은 아래 3개이다. 장점 1. 접근성 가 제공하는 기능은 Zeppelin 또는 Jupyter 와 유사하나, 웹 기반이어서 접근성이 뛰어나다. 특히 비개발 직군 유저들이 VDI 접속 없이 데이터를 만져보도록 환경을 구성할 수 있다. 쿼리결과 파일 다운로드는 물론이고, 다양한 데이터 관련 솔루션로 데이터를 연동시킬 수 있다. - 마케터: Google Data Studio, Excel - 기획자(Product Manager): Jupyter, Tableau - 데이터 분석가: SPSS, R, Algorithmia 장점 2. 리스크 감소 DB ..
-
Python 웹 크롤링을 위한 준비 - 웹 드라이버 지정데이터 분석/NumPy 2020. 2. 23. 16:30
OS: Mac Python Version: 3.8 IDE: PyCharm external library: selenium selenium 하위 webdriver.Chrome 에서 크롬 드라이버에 대해 제어하도록 준비한다. 크롬 드라이버를 별도로 설치한 후, selenium.webdriver 로 웹드라이버를 구동하면 된다. ※ 크롬 드라이벌 설치 경로 [클릭] from selenium import webdriver driver = webdriver.Chrome(executable_path= r'/Users/youkyunghwang/PycharmProjects/202002/chromedriver') --- console log selenium.common.exceptions.WebDriverException..
-
Pycharm 외부 라이브러리 설치데이터 분석/NumPy 2020. 2. 23. 15:32
OS: Mac Python Version: 3.8 IDE: PyCharm 정식개발자가 아닌 나는 시스템 환경변수 설정, 디렉토리 등이 소스코드 자체보다 더 어려운데, Pycharm 은 많은 부분을 해결해준다. 최고!!! Pycharm 에서 import 를 할 때, 미설치된 라이브러리라면 오류 버튼이 뜨고 install 가이드를 따르면, 프로젝트 하위 venv > lib > site-packages 에 설치해준다. (venv 는 virtualenv 가상환경의 약자) venv를 쓰면 프로젝트 하위 venv > lib > site-packages 에 설치된 라이브러리만 읽을 수 있고, virtualenv 는 서로 다른 프로젝트에서 파이썬 패키지 (+버전) 을 관리하기 위해 사용된다. 파이썬 패키지를 전역에 설..
-
HackerRank Mysql 문제풀이 - Binary Tree Nodes데이터 분석/DB & SQL 2019. 12. 15. 17:47
HackerRank Mysql - Binary Tree Nodes 사전지식. - Sub Query 서브 쿼리 - Control Flow Function 제어문 - NULL 체크 1. 문제 해석 You are given a table, BST, containing two columns: N and P, where N represents the value of a node in Binary Tree, and P is the parent of N. Write a query to find the node type of Binary Tree ordered by the value of the node. Output one of the following for each node: Root: If node is roo..
-
hackerrank mysql Occupations 문제풀이데이터 분석/DB & SQL 2019. 12. 15. 16:11
HackerRank Mysql : Occupations MySQL :: MySQL 8.0 Reference Manual :: 12.4 Control Flow Functions MySQL 8.0 Reference Manual / Functions and Operators / Control Flow Functions 12.4 Control Flow Functions Table 12.6 Flow Control Operators Name Description CASE Case operator IF() If/else construct IFNULL() Null if/else construct NULLIF() Return NULL dev.mysql.com 위 문제는 아래 3 가지를 숙지해야 풀 수 있는 문제이다. 아..
-
서브쿼리 Sub Query - 상관쿼리와 비상관쿼리데이터 분석/DB & SQL 2019. 5. 12. 22:12
서브쿼리에서 어려운 점은 구조가 아니고, 쿼리의 어느 부분이 서브 쿼리인지 또는 서브 쿼리를 사용할 필요가 있는지를 알아내는 것입니다. Q. 내 리스트에 있는 사람들 중에 누가 연봉이 가장 많을까? - 내 리스트의 누가? SELECT first_name, last_name FROM my_contact_list - 내 리스트의 연봉? SELECT salery FROM job_current; - 가장 많은 연봉: SELECT MAX(salary) FROM job_current; my_contact_list mc 와 job_current jc 에서 mc.first_name, mc.last_name, jc.salery 를 가져옵니다. 그런데 조건! jc.salery 가 가장 높은 연봉인 사람만! 가장 높은 연봉..
-
SELECT 쿼리의 좋은 습관데이터 분석/DB & SQL 2019. 5. 5. 12:54
쿼리의 대부분은 SELECT 조회 쿼리이다. 요새는 기획자들도 Hue 를 통해 DB 에 접근하고 SELECT 쿼리를 실행하기도 한다. 나 같은 초심자를 위해 SELECT 쿼리를 작성할 때의 좋은 습관과 주의사항을 정리해보았다. SELECT 문을 위한 좋은 습관 - 쿼리문에 따라 성능이 좌지우지 된다. 쿼리문에 따라 성능이 좌지우지 된다. 심지어 아주 가끔은 잘못 쓰면 DB가 사망하는 경우가 가끔 있다. --- 위보다는 아래처럼 SELECT * FROM easy_drinks; SELECT drink_name, main, second FROM easy_drinks; --- 전체 필드를 보고 싶다면, 행을 줄여서 SELECT * FROM easy_drinks limit 10; --- WHERE 조건은 다음 라..
-
DB 와 SQL 공부를 시작하며 - DB와 엑셀 비교데이터 분석/DB & SQL 2019. 5. 5. 11:42
데이터베이스 DB : 테이블 그리고 테이블과 관련된 SQL 구성요소들을 담고 있는 저장소 주로 RDBMS Relational DataBase Management System 이 사용되지만, 최근에는 NoSQL 도 많이 사용되는듯. NoSQL 이 비정형화 데이터를 쭈욱- 나열해서, RDB 사용할 때의 복잡한 데이터 구조와 JOIN 쿼리 실행을 안해도 된다는 장점이 있다고 한다. 쭈욱 나열된 걸 사용자가 정리해서 봐야하는게 더 스트레스일 것 같기는 한데. 아직 NoSQL 을 경험해보지 않아서 잘 체감이 안된다. 테이블 Table : 열과 행으로 구조화하여 보관하고 있는 데이터베이스의 구성요소 엑셀파일은 데이터베이스, 테이블은 엑셀의 스프레드시트와 유사하다. 엑셀 신들은 생각보다 많은 것들을 하신다. 가만히 ..