• python 시각화: Stacked Bar Chart 그리기

    python을 빠르게 익히기 위해 DS스쿨의 실전 데이터분석가 과정을 1월에 수강했었다. 이 코스를 선택한 가장 큰 이유는 수업에서 제공하는 몇몇 스타트업의 로그데이터와(많이 정제된 버전이지만) 이후의 채용연계 과정이 궁금해서였다. 마지막 4주차 강의가 끝날 때 특정 스타트업에서 제공한 과제를 풀고 있는데, 누적 막대 그래프를 그려야 할 일이 생겼다. 이론적으로 너무 간단한 일이지만 의외로...


  • [요약] R 유저를 위한 Python/Pandas 패키지

    R을 쓰는 중이면서 python을 배우려 할 때 딱 맞는 강의를 찾아냈다. DataCamp의 ‘Python for R users‘라는 코스다. 입문자를 위한 코스들과 달리 좀 더 압축적으로 빠르게 진도를 뺀다. 중간중간 R과 비교해주는 포인트도 좋다. 강사 특성인지는 모르겠지만 설명도 더 쏙들어오게 해주는 것 같다. 하는 김에 R문법과 비교하며 Pandas의 기초적인 부분을 짚어보았다. 1....


  • python 시각화: Seaborn 패키지(1)

    python을 공부하는 초반이라, 탐색적 분석에 필요한 시각화 방법들을 익히고 있다. seaborn은 EDA를 효율적으로 할 수 있다는 점에서 무척 매력적인 패키지다. 그래서 처음으로 공식 문서를 샅샅이 읽어보며 정리해본다. 참조 : https://seaborn.pydata.org/introduction.html 왜 만들어졌나? 데이터를 탐색하고 이해하는 과정에서 visualization이 핵심 역할을 하게끔 하려고 특징 여러 변수 간의 관계를 탐색하는 데에 좋다. 특히...


  • 2018년 회고, 2019년 목표

    2018년 회고와 간단한 2019년 새해 목표를 세워본다. 올해는 좀 진지하게 고민해보고 싶었는데, 막상 글로 옮기는 건 또 시간에 쫒겨 키보드를 두드리고 있다. 슬프지만 약식으로 올려 본다. 공부와 성장 중심으로 회고를 하려 했지만, 절대적인 시간이 부족한 두 아이 엄마 직장인이다보니 육아니 수면패턴이니 하는 얘기들이 언급될 수밖에 없었다. 내년 회고에는 어서빨리 생활이...


  • [데캠] python 기초 (1) : Data structure

    연말을 맞아 그동안 미뤄뒀던 python을 바짝 해보기로 했다. DataCamp의 Intermediate python을 공부한 내용을 정리해본다. Intermediate python은 Intermediate R과는 달리 초급 내용이 섞여있어서 전에 Codecademy에서 훑었던 내용과 겹치긴 한다. 하지만 R을 해보니, 기본이 튼튼하지 않으면 나중에 뭘 모를 때 검색하기도 애매했던 것 같다. 어쨌든 기초수업은 마지막이라 생각하고 꼼꼼히 들어보려 한다. DataCamp의...