• [회고] 글또 2기를 마치며

    시간이 어쩜 이렇게 빨리 흐르는지 모를 일이다. 글또 2기가 벌써 마무리할 시기가 되어 회고 글을 올릴 때가 되었다. 이번 글또에서는 데이터분석머신러닝 방의 퍼실리테이터를 맡았었다. 이 분야의 공부가 깊지 못해 댓글을 잘 달진 못하고 이모지만 열심히 눌렀던 것 같다. 하지만 늘 그렇듯, 뭐라도 안하는 것보단 하는 게 낫기에 더 공부가 되었던...


  • <파이썬 클린 코드> 1장 요약

    들어가며 도서관에 들어온 신착자료 목록을 보다가 <파이썬 클린 코드>를 발견했다. 어렴풋이 필요하다고 느끼고는 있지만, 클린 코드가 정확히 뭘 뜻하는지 몰랐기에 빌려왔다. 막상 내용을 훑어보니 중반 이후는 내가 소화하기 힘든 내용이고, 아직까진 ad-hoc 분석을 위해 python을 쓰는 입장에서 다 필요한 것 같지도 않다. 하지만 현재 기준으로 필요하다 느껴지고 이해할 수 있는...


  • 파이썬 업무자동화 : 자동실행과 메일/슬랙 메시지 보내기

    들어가며 업무시간에 떳떳하게 코딩하려고 웹크롤링을 시작했더니, 마케터를 위한 업무자동화 같은 패스트캠퍼스 커리큘럼이 눈에 들어오기 시작했다. 제한된 업무시간을 활용하다 보니 나 역시 일의 효율을 높여주는 ‘업무자동화’로 접근하게 되던 참이었다. 해당 커리큘럼들에선 특히 아래와 같은 사용씬들이 눈에 들어왔다. 상품 정보, 가격현황을 빠르게 수집하기 소비자 반응 파악을 위해 다양한 참여도 데이터 수집 (게시글,...


  • 웹크롤링 시 Selenium을 이용한 브라우저 컨트롤 - 스크롤다운

    특정 기업 홈페이지에서 상품명과 가격, 옵션을 크롤링하는 작업을 하고 있다. 웹사이트마다 만들어진 방식이 다양하다 보니, 주로 아래와 같은 작업이 필요했다. 전체 상품 크롤링 스크롤다운 페이지네이션 상세 상품정보 획득 마우스오버 (hovering) URL 통해 상세 페이지로 이동 이 중에는 for 문을 이용해 BeautifulSoup에서 해결할 수 있는 것도 있고, Selenium과 Webdriver를 이용하는 게...


  • python 웹 크롤링/스크래핑 라이브러리

    들어가며 도저히 개인적으로 포트폴리오 만들 시간을 내기 어려워, 회사에서 업무에 관련된 내용을 웹크롤링/분석하는 방법을 시도해보기로 했다. 점심시간과 자투리 시간을 떳떳하게 사용하는 것이다. 개인이 취미로 코딩할 때와 실제 업무에서 할 때의 가장 큰 차이는, 시간 효율이 중요해지고 업무량과 소요시간을 예측할 수 있게 된다는(할 수 있어야 한다는) 점일 것이다. 내 경우는 R을...