• 글또 2기를 시작하며

    드디어 글또 2기 활동의 시작이다. 참고하려고 2기 시작 때 썼던 다짐글을 보니 꽤 부담스러워했던 흔적이 보인다. 완주할 수 있을지에 대한 고민이 많았던 듯하다. 하지만 1기에서 Pass 2번만 사용하고 완주한 덕분에 글쓰기에 부담이 많이 적어진 것 같다. 물론 이번에도 고민이 없었던 건 아니다. 육아휴직 때와 달리 진득히 앉아 집중할 내시간을 만들기가...


  • [공부] Datacamp 머신러닝 - 지도학습 : 분류

    대전제 : making more accurate predictions 3. Logistic Regression Automatic Feature selection Stepwise Regression 로지스틱 회귀는 사전에 예측변수를 정해야 함 종류 Forward Stepwise : 변수를 지워나감 Backward Stepwise : 변수를 추가해나감 몇몇 단점으로 인해 자주 쓰이진 않음 단점 최적의 모델을 찾아낸다고 장담할 수 없음 이 절차는 통계적인 가정을 위배함 현실...


  • [번역/요약] 검색 로그 분석 : 웹UX 리서치에서 가장 과소평가된 기회영역

    Summary : 웹사이트의 검색엔진은 방문자들이 뭘 원하는지, 그걸 어떻게 찾는지, 당시의 컨텐츠 전략이 그들의 니즈를 얼마나 충족시켜 주는지를 말해줄 수 있다. 원문 : Search-Log Analysis: The Most Overlooked Opportunity in Web UX Research Introduction 사이트 검색 로그 분석은 UX 리서치에서 간과되는 가장 큰 기회영역 중 하나다. 방문자를 끌어들이기 위한 외부...


  • R Shiny로 포트폴리오 삽질기 (2)

    지난 글에 이어서 R Shiny로 웹 애플리케이션을 만들면서 겪고 있는 문제-해결책을, 삽질의 기록을 남겨본다. 1. 데이터 load하기 Shiny 튜토리얼이나 예제들에 내가 원하는 코드가 없어서 오래 걸렸다. 하는 김에 Shiny에 데이터를 load하는 3가지 방법을 정리해보면 다음과 같다. 1) R package에 포함된 데이터 분석 Shiny 예제에 가장 많이 등장하는 방법이다. 주로 아래...


  • R Shiny로 포트폴리오 삽질기 (1)

    Motivation 얼마 전부터 R Shiny로 뭔가를 만들어보고 있다. 데이터 분석가로 커리어체인지를 준비하고 있는데, 현업에서 다루는 고객조사 데이터는 크기도 작고 성질이 많이 달라 포트폴리오가 꼭 필요해서다. 사실 내 경우는 동작하는 프로토타입보다는, 전처리 과정에서의 기본기와 탐색적 분석에서 얻어내는 인사이트 등을 보고서로 정리하는 게 가장 좋다. 그래서 원래는 Rmarkdown이나 Python Notebook을 사용해 포트폴리오를...