
주인장 이력안녕하세요. 상담이 하고 싶어 심리학과에 진학했지만, 정작 연구방법론이라는 수업에서 실험을 통해 추상적인 생각을 정량화 하며 데이터 분석에 빠졌습니다. 그리고, 현재는 넥슨이라는 게임 회사에서 약 5년간 데이터 분석가로 일하고 있습니다.저는 아래와 같은 일들을 해왔고, 하고 있습니다!- 다수의 유관 부서가 참여하는 회의에서 1~2주 단위로 분석 주제 조율 및 인사이트 제공, 데이터 전처리 / 문제 정의 / 분석 인사이트 도출 / 액션아이템 제시까지 전반적인 과정 리딩- 고객 경험에 대한 맥락 정보를 추론할 수 있는 다수의 유저 세그멘테이션 설계 및 지표 관리- 추상적인 현상에 대한 정량화 및 지표 이상 탐지- 복잡한 현상을 직관적으로 표현할 수 있는 대시보드 구축 및 관리- 다량의 ETL ..
![[Boxplot] 박스플롯 이용시 주의사항](https://blog.kakaocdn.net/dn/ehG3yj/btrohUbtCFz/cs7FexdtRhZ5gKexdHeMJ0/img.png)

![[Pandas] 퍼널차트 데이터프레임으로 표현해보기](https://blog.kakaocdn.net/dn/d4bGge/btrb6T4hpKK/VE6Zk7JYw7HgAZL1PSwlr0/img.jpg)

![[지수함수] - 우리가 코로나 확진자 수에 놀라는 이유](https://blog.kakaocdn.net/dn/cfUuvG/btrq4xZMtAp/ZuDtDcdTPlYqmGaiq8gmk0/img.webp)








![[Grab] 수백만건의 주문을 저장하고 처리하는 노하우 (feat. DynamoDB)](https://blog.kakaocdn.net/dn/YPjyg/btr8J4aeUbu/LJcUnnuIAj5ehTPWK4tcvK/img.png)


![[PySpark] 자료 구조와 연산 원리 - 스파크 누구냐 넌?](https://blog.kakaocdn.net/dn/bjIGfE/btrFIc7jjiO/GC0CEDGCAuxW1gqbthEKrk/img.png)
![[SQL] 윈도우 함수 범위 지정을 이용하여 퍼널 분석 로직 짜보기 - feat.window frame](https://blog.kakaocdn.net/dn/bHpxPE/btrENf5QOz8/OMf1jIqTAz0YpWwxIpLxc0/img.png)
![[Airflow] 데이터 적재 파이프라인 튜토리얼 - 서울시 지하철호선별 역별 승하차 인원 정보 적재하기](https://blog.kakaocdn.net/dn/381v0/btrEAzve8h2/2sm2KUygyEktpcchy3LUHK/img.png)

글또 시즌의 막바지가 다가왔다. 달성하고자 했던 목표가 너무 높아서일까? 매번 이 시즌만 다가오면 뭔가 모르게 아쉽다는 감정이 든다.어쩌면 다시는 돌아오지 않을 회고의 순간일 수도 있어서인지, 오늘은 유난히 더 아쉬운 마음이 든다. 글또를 처음 안 건 3년전쯤, 5기 모집 공고였다. 마침 네이버에서 깨작깨작 블로그에 글을 쓰고 있던 터라 한껏 들뜬 마음을 가지고 신청 링크를 클릭했다.하지만, 정말 정말 아쉽게도 마감 다음날 링크를 발견했었다. 더 충격적인 건 한번 놓치면 6개월이나 기다려야 한다는 사실. 긴 기다림 끝에 6기 공고를 볼 수 있었고, 이번에는 기간 안에 무사히 신청할 수 있었다. 그리고, 지금까지 약 3년 반 상경하고나서 70% 가량의 시간을 글또와 함께 보냈다. 처음 작성했던 글이다...

들어가며지난 2월 13일 글쓰기 커뮤니티 글또에서 데이터 채널 반상회가 진행되어 참여했었고 참여한 후기를 작성해보고자 한다. 지난 반상회들나는 지금까지 총 3번, 데이터 반상회를 참여했다. 첫번째 참여는 행사 주최 운영진으로 참석했었다.당시, 미리캔버스로 포스터를 만들었었고 90분 정도 되는 참석자 분들에게 DM을 드렸던 기억이 새록새록난다.지금과는 다르게 직무 구분(데이터, 프론트, 백엔드 등)을 하지 않았었고 발표가 조금 더 많은 포맷이었다. 두번째 참여는 발표자로 참여했었다. 글또 내에서 발생하는 슬랙 데이터를 수집하고 분석한 내용물을 공유했었다. 운이 좋게 해당 발표를 가지고 데이터야놀자에서도 발표를 할 수 있었다. 세번째는 티켓팅에 실패해 참석하지 못했었다 🥹🥹🥹 네번째 반상회옆자리에 앉..

들어가며- 간단하게 Pyspark를 테스트할 수 있는 환경을 구성하고, 조금 더 나아가 여러 개의 컨테이너를 만들어 Master노드와 Worker노드를 연결 해보고자 함- ubuntu이미지 위에서 별도로 spark를 세팅하기 보다는 이미 만들어져 있는 spark이미지를 최대한 활용해보고자 함- 컨테이너 실행은 총 4가지 방법으로 실행해 볼 것임1.bitnami, Apache 이미지로2.Jupyter Notebook에서 Pyspark 실행3.Master & Worker 노드 클러스터 만들기 - docker run 4.Master & Worker 노드 클러스터 만들기 - docker compose- 필자는 M1 맥북을 쓰고 있고, docker desktop Apple Silicon 버전을 깔아놨음~그럼 ..

들어가며취업을 준비하는 많은 대학생들이 으레 하듯, 나도 "공모전"포스터 앞에 삼삼오오 모여있던 시절이 있었다. 다만, 나는 수상은 한번도 한적이 없었다. 그리고 어떨 때는 함께 했던 사람들과 아쉽게 공모전을 끝낸적도 있었다. 왜 그렇게 끝이 나버린걸까. 수년이 지난 지금에서야 이 생각을 다시 하는 이유는 최근 한 권의 책을 읽었기 때문이다. 하지만, 그 책의 내용에 대해 당장 설명하지는 않을 것이다. 왜냐하면, 책의 말미에 아래와 같은 권고 사항들이 있기 때문이다. 1. 변화하려고 하는 자기 자신에게 집중하기2. 책을 접하지 않은 사람들에게 책에서 설명하는 어려운 용어에 대해 언급하지 않기 그래서, 나름 모범생 코스프레를 해보고자. 책의 내용을 직접 언급하기 보다는 책을 읽으며 들었던 몇 가지 생각..

들어가며데이터 업무하다 보면 마주하는 케이스 (1) A님 갑자기 제 배치가 안돌아요- 아 alpha_omega 테이블 참조하셨죠? 그거 오늘부터 alpha_beta로 적재됩니다~(2) 뭐야 휴지는 없어도 휴지심은 있어야 되는데? (갑작스러운 null 출현) dbt공홈 문서를 보다보면 유독 자주 등장하는 단어가 있다. “software engineering” 한발 더 나아가서data analysts should adapt similar practices and tools to software developoers 이렇게 까지..! 얘기를 한다. 물론, 분석하기도 바쁜 상황이지만.. dbt를 사용하면Version Control - Analytic code는 반드시 버전 관리를 해야 함, 비즈니스 요구 ..