Jessy Min's blog
Data Analyst & UX researcher on the Road
-
파이썬 업무자동화 : 자동실행과 메일/슬랙 메시지 보내기
들어가며 업무시간에 떳떳하게 코딩하려고 웹크롤링을 시작했더니, 마케터를 위한 업무자동화 같은 패스트캠퍼스 커리큘럼이 눈에 들어오기 시작했다. 제한된 업무시간을 활용하다 보니 나 역시 일의 효율을 높여주는 ‘업무자동화’로 접근하게 되던 참이었다. 해당 커리큘럼들에선 특히 아래와 같은 사용씬들이 눈에 들어왔다. 상품 정보, 가격현황을 빠르게 수집하기 소비자 반응 파악을 위해 다양한 참여도 데이터 수집 (게시글,...
-
웹크롤링 시 Selenium을 이용한 브라우저 컨트롤 - 스크롤다운
특정 기업 홈페이지에서 상품명과 가격, 옵션을 크롤링하는 작업을 하고 있다. 웹사이트마다 만들어진 방식이 다양하다 보니, 주로 아래와 같은 작업이 필요했다. 전체 상품 크롤링 스크롤다운 페이지네이션 상세 상품정보 획득 마우스오버 (hovering) URL 통해 상세 페이지로 이동 이 중에는 for 문을 이용해 BeautifulSoup에서 해결할 수 있는 것도 있고, Selenium과 Webdriver를 이용하는 게...
-
python 웹 크롤링/스크래핑 라이브러리
들어가며 도저히 개인적으로 포트폴리오 만들 시간을 내기 어려워, 회사에서 업무에 관련된 내용을 웹크롤링/분석하는 방법을 시도해보기로 했다. 점심시간과 자투리 시간을 떳떳하게 사용하는 것이다. 개인이 취미로 코딩할 때와 실제 업무에서 할 때의 가장 큰 차이는, 시간 효율이 중요해지고 업무량과 소요시간을 예측할 수 있게 된다는(할 수 있어야 한다는) 점일 것이다. 내 경우는 R을...
-
python 시각화: Stacked Bar Chart 그리기
python을 빠르게 익히기 위해 DS스쿨의 실전 데이터분석가 과정을 1월에 수강했었다. 이 코스를 선택한 가장 큰 이유는 수업에서 제공하는 몇몇 스타트업의 로그데이터와(많이 정제된 버전이지만) 이후의 채용연계 과정이 궁금해서였다. 마지막 4주차 강의가 끝날 때 특정 스타트업에서 제공한 과제를 풀고 있는데, 누적 막대 그래프를 그려야 할 일이 생겼다. 이론적으로 너무 간단한 일이지만 의외로...
-
[요약] R 유저를 위한 Python/Pandas 패키지
R을 쓰는 중이면서 python을 배우려 할 때 딱 맞는 강의를 찾아냈다. DataCamp의 ‘Python for R users‘라는 코스다. 입문자를 위한 코스들과 달리 좀 더 압축적으로 빠르게 진도를 뺀다. 중간중간 R과 비교해주는 포인트도 좋다. 강사 특성인지는 모르겠지만 설명도 더 쏙들어오게 해주는 것 같다. 하는 김에 R문법과 비교하며 Pandas의 기초적인 부분을 짚어보았다. 1....