주인장 이력안녕하세요. 상담이 하고 싶어 심리학과에 진학했지만, 정작 연구방법론이라는 수업에서 실험을 통해 추상적인 생각을 정량화 하며 데이터 분석에 빠졌습니다. 그리고, 현재는 넥슨이라는 게임 회사에서 약 5년간 데이터 분석가로 일하고 있습니다.저는 아래와 같은 일들을 해왔고, 하고 있습니다!- 다수의 유관 부서가 참여하는 회의에서 1~2주 단위로 분석 주제 조율 및 인사이트 제공, 데이터 전처리 / 문제 정의 / 분석 인사이트 도출 / 액션아이템 제시까지 전반적인 과정 리딩- 고객 경험에 대한 맥락 정보를 추론할 수 있는 다수의 유저 세그멘테이션 설계 및 지표 관리- 추상적인 현상에 대한 정량화 및 지표 이상 탐지- 복잡한 현상을 직관적으로 표현할 수 있는 대시보드 구축 및 관리- 다량의 ETL ..
들어가며데이터 업무하다 보면 마주하는 케이스 (1) A님 갑자기 제 배치가 안돌아요- 아 alpha_omega 테이블 참조하셨죠? 그거 오늘부터 alpha_beta로 적재됩니다~(2) 뭐야 휴지는 없어도 휴지심은 있어야 되는데? (갑작스러운 null 출현) dbt공홈 문서를 보다보면 유독 자주 등장하는 단어가 있다. “software engineering” 한발 더 나아가서data analysts should adapt similar practices and tools to software developoers 이렇게 까지..! 얘기를 한다. 물론, 분석하기도 바쁜 상황이지만.. dbt를 사용하면Version Control - Analytic code는 반드시 버전 관리를 해야 함, 비즈니스 요구 ..
들어가며최근 들어, 팀 내에서도 그리고 글또에서도 새로운 환경에서 ETL 파이프라인을 구축해 볼 기회가 생김에 따라 Airflow를 이전보다는 조금 더 깊게 알아야 할 필요성이 생겼다. 이에 따라, Airflow를 공부하며 관련된 내용들을 정리해보는 중인데, 오늘은 나와 같은 초보자의 관점에서 Airflow를 테스트 환경을 구성하고 DAG을 만들고 실행하는 과정에서 몇 가지 기본적인 개념들을 다루어보고자 한다.DAG란?Airflow is a platform that lets you build and run workflows. A workflow is represented as a DAG (a Directed Acyclic Graph), and contains individual pieces ..
- 최근, 인스타 광고(데이터 분석 광고)를 통해 우연찮게 제가 예전에 썼던 "파이썬으로 퍼널 분석 하는 글"과 유사한 이미지를 발견하였습니다.- 처음에는 반가운 마음이 들었습니다. 어? 나도 비슷한 내용으로 글썼었는데..!https://gibles-deepmind.tistory.com/entry/Pandas-%ED%8D%BC%EB%84%90%EC%B0%A8%ED%8A%B8-%EB%8D%B0%EC%9D%B4%ED%84%B0%ED%94%84%EB%A0%88%EC%9E%84%EC%9C%BC%EB%A1%9C-%ED%91%9C%ED%98%84%ED%95%B4%EB%B3%B4%EA%B8%B0 [Pandas] 퍼널차트 데이터프레임으로 표현해보기0. 퍼널 차트몇 명이나 깔때기를 통과할까? 좌측 퍼널 차트는 얼마나 ..
지난주 주말, 인사이드 아웃2 영화를 봤다. 원작의 경우, 기쁨/화남/슬픔/까칠/소심 5가지의 감정만 있었지만 주인공인 '라일리'가 고등학교 진학을 앞두며 다루는 문제들이 복잡해지고 이에 따라 불안/질투/당황 등의 감정이 추가됐다. 새로 등장한 감정들이 라일리의 문제 해결에 있어어떤 역할을 하는지 관찰하는 것이 인사이드 아웃2의 묘미라고 할 수 있다. 영화 초반 라일리는 친구들과 하키 캠프를 떠난다. 하지만, 친구 2명은 이미 다른 고등학교에 배정을 받은 상황.다른 고등학교에 가게 된 라일리는 친구들을 못 사귈까봐 전전 긍긍하는 상황. 여기서 "불안" 이라는 감정이 등장한다. 딱 봐도 정신 없어 보이는 "불안"은 모든 상황을 통제하고, 예측할 수 없는 상황에 대비하고자 한다."기쁨이"가 라일리의 유년시절..
- 가짜연구소에서 "온라인 통제 실험 연구자로 거듭나기"라는 이름의 A/B테스트 스터디에 참여하고 있다. 현재 까지, 온라인 통제 실험 소개 및 분석 기초 Chapter2 실험의 실행과 분석 - 엔드 투 엔드 예제 Chapter6 조직 운영을 위한 지표 Chapter7 실험을 위한 지표와 종합 평가 기준 (OEC) - 위 주제들로 총 4번의 스터디를 진행하였고, Chapter17 온라인 종합 대조 실험에 사용되는 통계 이론 챕터를 내가 맡게 되어 오늘은 겸사 겸사 책에 대한 내용을 블로그에 적어보려 한다. 흡연은 통계의 필요성을 알려주는 주요 요인 중 하나이다. - 플레처 네벨 - Chapter의 첫 장에 나오는 문장이다. 플레처 네벨씨는 왜 저런 말씀을 남기셨을까? 궁금해서 찾아봤더니, 이분 꽤 유명한..