리스트 : 콘텐츠가 있으면 최근 5건을 불러옵니다.
-
matplotlib 그래프 그리기 - 꺾은선 그래프matplotlib 2022.08.15 23:16
matplotlib 에서 제어가능한 여러 요소들을 해부해본다! matplotlib: 파이썬에서 차트나 플롯으로 데이터를 시각화하기 위한 모듈 - 그래프 종류: 산점도, 꺾은선 그래프, 막대 그래프, 히스토그램, 박스 플롯 0. font 설치 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 출처: https://teddylee777.github.io/colab/colab-korean 1. 데이터 시각화의 대상, DataFrame 불러오기 import pandas as pd df = pd.read_csv('시간대별_상품판매량.csv', engine='python', encoding..
-
Pandas 집계 - pivot_table vs. groupbyPandas 2022.08.15 18:53
기본 통계량 확인 - 기본 통계량: describe() 조건에 따른 변수통계량을 요약한 테이블 - 출력물 자체가 결과물인 경우에는 pivot_talbe - 출력물이 중간 산출물인 경우에는 groupby (as_index=False) 즉, 우리는 groupby 를 많이 쓰게 될 것이다! describe() df.describe() pd.pivot_table() 데이터프레임, 행 조건, 열 조건, 집계대상 컬럼목록, 집계함수 pd.pivot_table( data=df, index='제품', columns='쇼핑몰 유형', values=['수량', '판매금액'], aggfunc='mean' ) df.pivot_table( index='제품', columns='쇼핑몰 유형', values=['수량', '판매금액..
-
File handling개발환경 세팅 2022.08.15 17:04
다양한 local file 에 대해서 file handling 을 하게 된다. Tabular 표 형식의 데이터인 .csv, .xlsx 를 불러오고, 읽는 과정을 학습한다. File Handling # data 초기화 header = [] data = [] # file 읽기 with open('./data_reading.csv', 'r') as f: header = f.readline() line = f.readline() while line: data.append(list(map(float, line.split(',')))) line = f.readline() # file 작성하기 with open('./written_data.csv', 'w') as f: f.write(header) for line i..
-
Google Colab 에서 Github 로 코드 저장하기개발환경 세팅 2022.08.15 13:33
기존에는 매번 Google Colab 에서 노트북을 만들었다 지웠다 했다. 1. 누적되는 산출물로 관리하고 싶었다. 내가 어떤 공부를 했는지, 산출물을 관리했는지 확인하기 어려웠다. 2. 나도 블로그에서 github example code 를 제공해보고 싶었다. 그래서 나도 Github Repository 에 저장해보기로 했다. 1. GitHub 계정 만들기 https://github.com/ 2. Github Repository 생성 저는 Halora 계정에 ds 라는 Private Repository 를 생성했습니다. Repository 란 일종의 작업공간입니다. Repository 프로젝트 파일과 각 파일의 수정 히스토리를 담고 있습니다. https://github.com/halora/ds 3. G..
-
PM, 회사를 떠나고 싶지만 지금이 아닌 이유 4가지IT 기획자의 잡생각 2022.06.06 11:44
내가 성장하지 못한다는 압박감이 계속되고 있다. 내가 기술을 쌓아올리는 동안에 비즈니스 가치를 창출하는 데 기여했는지 확신이 서지 않는다. 누구보다 열심히 일했는데, 확신이 서지 않으니 공허감이 찾아온다. 난 항상 왜 이렇게 현실에 만족하지 못하고, 불안한걸까? 그걸 왜 항상 공부라는 방법으로 채우려고 하는 걸까? 인생살기 피곤하게. 하지만 부정적인 감정에 근거한 사람들은 그걸 발판으로 삼아 자신을 성장시킨다고 했다. 꼭 나쁘게 볼 것만은 아니라고 하는 그 말이 위안이 되었다. 애초에 무엇을 안해서 생기는 불안이라면, 그냥 하면 그만이다. 적어도 무언가를 하고 있는 순간에는 불안하지 않으니까. 나는 30대 초반이다. 아직 최소 20년을 더 일할 수 있다. 조급해 하지 말자. 좋은 방향 설정이 중요하다. ..
나는 Back-end Platform PM 이다. 개발자분들이 개발 셋을 가지고 있는 것처럼 백엔드 PM 은 개발 셋을 이해하는 기술(?) 을 가지고 있어야 한다고 생각한다. 나는 IT 산업의 가치가 마음에 들었다. PM 업무를 하던 하루하루가 흥미로웠고, 돈벌이 이상의 의미였다. 미래에도 IT 산업에 기여하고 싶었다. 하지만 통상 PM 의 수명이 40대 초반 정도에 끝난다고들 했다. 그 이후에는? 사업이나 전략 직군으로 전환한다는 얘기도 많았다. PM 의 역할은 소위 어르신들이 하기에 너무 구질구질한 일이라고들 했다. 맞는 말일지도. 사실 프로덕트 구현은 바람 잘 날이 없어서 외부에서 기대하는 것만큼 멋있는 일들만 하는 것은 아니다. 5% 의 멋있는 결정을 하기 위해 25 % 의 매 순간에 놓이는 의사..
데이터 분석 실습 with Python 패스트 캠퍼스 한 번에 끝내는 데이터 분석 초격차 패키지 Online 이 수업은 이론과 실습을 반복해서 좋다. 매번 조금씩 끄적거리다 포기한 내용을 차근차근 따라할 수 있게 해준다. Python 실습 부분 이나원 쌤이 노하우를 밝히기를 반복만이 생명이라고. 아래 반복과정을 숙지시켜서, 업무에 적용해보기로 한다. 1년 후의 나는 지금의 나보다 Data Literacy 가 늘기를 기원해본다. 너무 어려울 때에도 아래 5가지를 차근히 돌아볼 수 있도록 습관을 들여보자. 아래 5가지 과정을 반복하다보면, 역량과 자신감이 쌓여있을 것이다. 1. 데이터 파악하기 2. 질문하기 3. 데이터 정비하기 4. 답변하기 5. 시각화하기 1. 데이터 파악하기 데이터에 대한 설명을 읽는다..
IT PM 중, hello world 출력해보지 않은 PM 은 없을 것이라고 생각한다. 그리고 요새는 막연한 마법과 같은 단어: AI / Machine Learning / Deep Learning 를 어떻게 활용해야하는지 애를 먹는 분들이 많을것이라고 생각한다. 나도 막연하게 ML 에 대한 환상이 있는 PM 중에 하나. 그래서 ML 로 가장 유명한 Tensorflow 가이드를 살펴보기 시작했다. 그리고 굉장히 쉽다! ML의 정체가 궁금하신 분들은 꼭 아래 Tutorial 을 해보시기를. 한글이 지원되고, 딱 20분만 소요하면 된다. https://developers.google.com/codelabs/tensorflow-1-helloworld#0 Say hello to the "Hello, World" ..