• Kaggle Kernel로 BigQuery 사용하는 법

    대용량 데이터를 다뤄보고 싶을 때, Kaggle Kernel을 이용하면 BigQuery를 사용해볼 수 있다. 물론 Google BigQuery 사이트에서 곧바로 이용해도 된다. 하지만 Kernel을 이용하면 데이터를 추출한 뒤 곧바로 시각화해볼 수 있다는 장점이 있다. Kaggle은 이와 같은 Filtering - Manipulation - Visualization 작업을 매끄럽게 할 수 있도록 bq_helper라는 python 라이브러리를 제공한다. bq_helper 라이브러리...


  • SQL 독학할 때 실습하는 방법

    실무에서 SQL을 쓰게 되면 개구리 올챙이 시절 생각 못하듯 싹 잊어버릴 고민이 있다. 어떻게 SQL을 실습할 것인가, 직접 쿼리를 돌려볼 것인가 하는 문제다. 작년 이맘때 내가 SQL 독학을 시작할 때만 하더라도 이 부분이 많이 답답했다. 하지만 공부를 하면서 여러 가지 방법이 있음을 알게 되었다. 개인적으로 1 -> 3 -> 2...


  • [번역] 어떨 때 데이터분석에 SQL을 써야 하는가?

    GA, Kissmetrics 등의 웹로그 분석 툴들은 나날이 발전하고 있다. 그럼에도 스타트업들이 일정 시점에 이르면 Python, R, SQL 등에 능숙한 데이터분석가를 별도로 채용하는 이유는 무엇일까? 분석 툴로 할 수 없거나 효율이 떨어지는 부분은 구체적으로 어떤 것들인가? 아직 스타트업에서 일하고 있지 않은 나는 그점이 늘 궁금했다. 아래 내용은 Segments 웹사이트의 Analytics Academy...


  • 해커랭크 SQL Practice 정주행 후기

    지난 3월 중순부터 약 한 달간 해커랭크에 있는 SQL practice를 정주행했다. 발단은 ‘코딩 테스트를 해커랭크로 내는 회사들도 있다’는 얘기를 들어서였다. 결과적으로는 입문/초급에서 중급으로의 언저리를 맴돌던 실력이 확 늘었다고 느끼는 계기가 되었다. 무엇을 할 수 있는지와 함께 어떻게 접근하는지를 보는 게 코딩테스트라면, 그 ‘어떻게’를 짧은 시간에 밀도있게 트레이닝하는 기회였다. 해커랭크의 SQL...


  • [번역] WHERE이나 ON을 이용해 필터링하기

    아래 내용은 Mode Analytics 웹사이트의 SQL 튜토리얼 중 WHERE이나 JOIN ON을 이용한 필터링에 관한 내용을 번역한 것이다. 세줄요약 : ON에 사용한 필터링 조건은 JOIN이 일어나기 전에 적용된다. 따라서 한 테이블에만 적용시키는 WHERE의 용도로 쓸 수 있다. WHERE은 두 테이블이 먼저 JOIN된 후에 결과 전체에 적용된다. 다만 WHERE을 이용하면 NULL값까지 필터링되므로...