• python 웹 크롤링/스크래핑 라이브러리

    들어가며 도저히 개인적으로 포트폴리오 만들 시간을 내기 어려워, 회사에서 업무에 관련된 내용을 웹크롤링/분석하는 방법을 시도해보기로 했다. 점심시간과 자투리 시간을 떳떳하게 사용하는 것이다. 개인이 취미로 코딩할 때와 실제 업무에서 할 때의 가장 큰 차이는, 시간 효율이 중요해지고 업무량과 소요시간을 예측할 수 있게 된다는(할 수 있어야 한다는) 점일 것이다. 내 경우는 R을...


  • python 시각화: Stacked Bar Chart 그리기

    python을 빠르게 익히기 위해 DS스쿨의 실전 데이터분석가 과정을 1월에 수강했었다. 이 코스를 선택한 가장 큰 이유는 수업에서 제공하는 몇몇 스타트업의 로그데이터와(많이 정제된 버전이지만) 이후의 채용연계 과정이 궁금해서였다. 마지막 4주차 강의가 끝날 때 특정 스타트업에서 제공한 과제를 풀고 있는데, 누적 막대 그래프를 그려야 할 일이 생겼다. 이론적으로 너무 간단한 일이지만 의외로...


  • [요약] R 유저를 위한 Python/Pandas 패키지

    R을 쓰는 중이면서 python을 배우려 할 때 딱 맞는 강의를 찾아냈다. DataCamp의 ‘Python for R users‘라는 코스다. 입문자를 위한 코스들과 달리 좀 더 압축적으로 빠르게 진도를 뺀다. 중간중간 R과 비교해주는 포인트도 좋다. 강사 특성인지는 모르겠지만 설명도 더 쏙들어오게 해주는 것 같다. 하는 김에 R문법과 비교하며 Pandas의 기초적인 부분을 짚어보았다. 1....


  • python 시각화: Seaborn 패키지(1)

    python을 공부하는 초반이라, 탐색적 분석에 필요한 시각화 방법들을 익히고 있다. seaborn은 EDA를 효율적으로 할 수 있다는 점에서 무척 매력적인 패키지다. 그래서 처음으로 공식 문서를 샅샅이 읽어보며 정리해본다. 참조 : https://seaborn.pydata.org/introduction.html 왜 만들어졌나? 데이터를 탐색하고 이해하는 과정에서 visualization이 핵심 역할을 하게끔 하려고 특징 여러 변수 간의 관계를 탐색하는 데에 좋다. 특히...


  • 2018년 회고, 2019년 목표

    2018년 회고와 간단한 2019년 새해 목표를 세워본다. 올해는 좀 진지하게 고민해보고 싶었는데, 막상 글로 옮기는 건 또 시간에 쫒겨 키보드를 두드리고 있다. 슬프지만 약식으로 올려 본다. 공부와 성장 중심으로 회고를 하려 했지만, 절대적인 시간이 부족한 두 아이 엄마 직장인이다보니 육아니 수면패턴이니 하는 얘기들이 언급될 수밖에 없었다. 내년 회고에는 어서빨리 생활이...