딥상어동의 딥한 생각

3년차 데이터 분석가의 23년 상반기 회고

by 딥상어동의 딥한생각

글또 8기가 끝나며, 마무리로 23년 상반기를 되돌아보려고 한다.

 

2년간 세 번 글또에 참여한 후기


엉 내가 글또를 세번이나? 응? 세번이나 했다 이말이야

- 6기부터 8기, 횟수로 3번째 글또가 끝났다.

- 글또는 개발자 글쓰기 커뮤니티이다.

- 2주에 한 번 글을 쓰고, 커피챗, 글또콘 등 다양한 커뮤니티 활동도 지원한다.

- 올해로 직장에서 일한지도 3년이 지났다.

- 묘한 연관성이 있어보이는 3이라는 숫자, 처음 직장에 입사하고 1년동안은 퇴근 외 시간을 잘 활용하지 못했다.

- 메이크 타임 같은 책도 읽어보고, 타임 트래커 모임도 참여했었다. 하지만, 책에 있는 내용은 제대로 실천하지 못했고 타임 트래커 모임에서도 중간에 하차하였다.

- 그러다가, 글또 커뮤니티 공고를 보고 참여하게 됐다. 그리고, 2년이라는 시간 동안 글또는 내 생활을 유지시켜주는 훌륭한 버팀목이 됐다.

- 이게 글또의 가장 큰 장점이다. 그렇다면, 어떻게 생활을 유지시켜 주게 되는가?

- 글또에는 명확한 아웃풋이 있다. 바로 2주마다 글을 제출해야 한다는 것. 2주마다 글을 쓴다는 건 쉽지 않은 행동이다. 그리고, 누군가에게는 굉장히 피로한 행위일 수 있다.

- 하지만, 이번 주간은 어떤 글을 쓰지? 고민 하면서 "글"과 관련된 소재를 고민하고 직접 부딪혀보며 일상의 시간을 효율적으로 활용할 수 있게 된다.

- 인간은 "아웃풋"이 명확해야 움직이는 동물이다. 그리고, "2주마다 작성하는 글 = 아웃풋"은 일상을 유지하는 훌륭한 동력이 된다.

- 그렇게 지난 2년간 지속적으로 글또에 참여하고 있다.

 


글쓰기 실력 향상


- 지금까지 글또를 세번 째 참여하며 특히, 이번 기수(8기)에 글쓰기 실력이 많이 향상되었다는 생각을 한다.

- 객관적인 지표로 이번 기수에 제출한 9개의 글 중 5개를 서핏에서 추천 리스트로 올려줬다.

- 이번 시즌 데이터 엔지니어 채널에 활동하면서 엔지니어링 관련된 글 위주로 작성했다. 

- 첫 글이 API관련된 내용이었는데, 내가 잘 모르는 부분이라 엔지니어 친구에게 질문을 자주했다.

- 그리고 친구가 솔직하게 피드백을 주었는데, 가감없이 적으면..

이 글을 봤을 때 -> 아는 사람은 더 알아갈게 없고, 모르는 사람은 더 헷갈릴 수 있음

- 이라는 피드백을 받았다. 친구를 손절할까 살짝 고민했지만, 듣고보니 맞는말같았다.

- 왜냐하면, 처음 글을 썼을 당시에도 나는 API를 잘 알지 못했기 때문이다.

- 그래서, API를 처음부터 다시 공부하고 글도 다시 썼다.

- 그리고, 처음 서핏에서 내 글을 추천해주셨다.

- 무엇 때문에 추천해주셨는지는 정확히 모르겠지만

- 이번 기수 들어 변화한 것 한 가지는 내가 작성하는 내용에 대해서 "정말 정확하게 알고자" 노력 했다는 것이다.

- 그리고, 이 변화가 내적으로도 외적으로도 좋은 결과를 가져왔다고 생각한다.


참여자에서 기여자로


- 학부 시절 데이터 분석 동아리 사람들과 하고 있는 활동들이 너무 좋아 진심으로 동아리가 오래 지속됐으면 하는 마음에 정말 열심히 동아리에 참여했다.

- 나 뿐만 아니라 동아리 사람들 모두가 최선을 다해 기여했고 그 결과로 3년간 동아리를 유지할 수 있었다. 

- 글또에서도 비슷한 마음을 느꼈고 이 곳이 잘 유지될 수 있도록 조금이라도 보탬이 되려 7기부터 운영진으로 참여하고 있다.

https://gibles-deepmind.tistory.com/entry/2022%EB%85%84-%EC%B2%AB-%EB%B2%88%EC%A7%B8-%EA%B8%80%EB%98%90%EC%BD%98-%EA%B0%9C%EC%B5%9C-%ED%9B%84%EA%B8%B0

 

2022년 첫 번째! 글또콘 운영 후기

들어가며 ‼잠깐 글또가 뭐죠? - 글또는 글쓰는 또라이의 약자로 2주마다 글쓰기를 진행하는 개발자 글쓰기 모임입니다. 자세한 내용은 아래 성윤님 노션 페이지를 참조해주세요! https://www.notion.

gibles-deepmind.tistory.com

- 7기 때는 다른 운영진 분들과 함께 글또콘을 운영했다.  

- 개인적으로는 행사 시간이 다  끝나고 저녁 10시 30분이 지나서 건물 입구 밖에서도 얘기를 나누시던 분들의 모습이 기억에 남는다.

- 코로나로 인해 대면 활동을 하지 못해 다들 아쉬우셨을 텐데, 글또콘이 그런 아쉬움을 해소해준 것 같아 개인적으로 뿌듯했다. 

- 8기 때는 동종 직무 분들의 오프라인 모임 주선을 위해 커피드백을 운영했다. 총, 3차례 운영했고(3회차는 현재도 진행중) 나/재휘님/수현님이 첫 번째 회차인 1회차를 맡아서 진행했다.

- 커뮤니티에 속한 인원 수 337명 중 326명, 97%가 참여할만큼 적극적으로 참여해주신 덕분에 성황리에 끝났던 것 같다.

- 다만, 두 가지 정도 아쉬움이 있었다. 첫 번째는 2회차 시작 시 인수 인계를 제대로 못해드렸던 점이다. 문서만 작성해서 건내드렸는데, 이슈가 있었던 건들에 대해 구체적으로 설명을 드리지 못했었다. 

- 두 번째, 최초 조 편성 시 관심사/지역 기반으로 조를 짜드렸다. 다만, 이 관심사라는 것에 우선순위가 없다보니 후순위인 관심사로 매칭되셨던 분도 계셨다.

- 그리고, 꼭 관심사 기반으로 얘기를 나눠야 할까?라는 고민도 안겨드렸던 것 같다. 이외에 조 편성 시에도 버거움이 있었던 것 같다. 관심사라는 변수 때문에 "의존성"만 하나 더 증가 하였다는 생각이 든다.

- 하지만, 아쉬움 속에서 한 가지 확실히 깨달은 부분이 있다.

- 커뮤니티 내에서 어떤 프로그램을 운영할 때 "지속성"에 대해서 반드시 고려해봐야 한다는 것이다.

- 구체적으로는 아래 두 가지 정도의 고민이 들었고 거기에 대해 아래와 같은 해답을 얻었다.

- 다음 기수에도 같은 수준으로 이 활동을 진행할 수 있을까?
 -> 만약 힘들다면 지금까지 진행했던 활동에 어떤 불필요한 의존성이 있는지 확인해보고 제거해야 한다.

- 내가 아니더라도 다른 사람이 이 활동을 이어서 진행할 수 있을까?
 -> 만약 의문이 든다면 "문서화"와 "진행 프로세스 정리"에 대해서 진지하게 고민해봐야 한다.

https://github.com/ddongmiin/geultto_genie_bot

 

GitHub - ddongmiin/geultto_genie_bot: 개발자글쓰기 커뮤니티 글또에서 "참여자 활동 목표 개선"을 위해

개발자글쓰기 커뮤니티 글또에서 "참여자 활동 목표 개선"을 위해 데이터를 수집하고 글또콘에서 강의를 진행했습니다. - GitHub - ddongmiin/geultto_genie_bot: 개발자글쓰기 커뮤니티 글또에서 "참여자

github.com

- 글또콘(8기 데이터 반상회)에서 데이터로 뜯어보는 커뮤니티라는 주제로 발표를 진행했다.

- 개인적으로 "나"뿐만 아니라, 서비스 사용자들의 목표 수립 및 개선 활동에 관심이 많은 편이다.

- 그리고, 그 목표 개선을 위해서는 데이터를 이용한 "활동 수치 정량화"가 필수적이다. 

- 글또에서도 관련된 작업을 하기 위해, 슬랙 데이터 수집 파이프라인을 만들고 실제 데이터 분석을 진행했다. 

- 부족함이 많지만, 혹시 내가 사용한 코드를 다른 사람도 사용할 수 있지 않을까 하는 생각에 정말 열심히 코딩했다.

- 그 결과로, 코딩하는 과정에서 그간 어깨 너머로만 배웠던 객체 지향이라는 개념에 대해 어느 정도는 익숙해 질 수 있었다.

- 또한, 발표 과정에서 성윤님께서 많은 피드백을 주셨는데 "사람들이 관심 있어할 만한 주제"에 대해서 많은 의견을 주셨다.

- 여기에 대해 개인적으로 얻은 결론은 사람들은 "나"와 "다른 사람들"의 활동에 관심이 많다는 것이다. 

- 그리고, 이런 관심을 바탕으로 사람들의 활동 목표를 개선시킬 수 있지 않을까라는 생각으로 분석에 접근했다.

- 많은 분들이 발표 내용에 공감해주셨고 나 또한 느끼는 바가 많았다.

- "활동을 측정하고" -> "측정한 수치를 바탕으로 목표를 수립하고" -> "개선하는" 작업은 앞으로, 직업적인 생활을 함에 있어서도 좋은 목표가 될 수 있을 것 같다는 생각이 있었다. 

- 저장한 슬랙 데이터를 정현님께서 잘 정리해주신 덕분에 데이터 기반으로 커뮤니티 내에서 열심히 활동하신 분들게 소소한 시상식을 진행할 수 있었다.

- 다음 시즌에는 사람들의 목표 달성에 도움을 줄 수 있는 데이터 프로덕트를 만들어보고자 한다. 


인과추론 스터디


https://gibles-deepmind.tistory.com/entry/%EC%9D%B8%EA%B3%BC%EC%B6%94%EB%A1%A0%EC%9D%B4-%EB%B6%84%EC%84%9D%EC%97%90-%EB%82%A0%EA%B0%9C%EB%A5%BC-%EB%8B%AC%EC%95%84%EC%A3%BC%EB%A0%A4%EB%A9%B4-feat-%EC%82%AC%EB%82%B4-%EC%8A%A4%ED%84%B0%EB%94%94-%ED%9B%84%EA%B8%B0

 

인과추론이 분석에 날개를 달아주려면 (feat. 사내 스터디 후기)

들어가며 - 인과 추론이 현업의 분석에 날개를 달아주지 않을까라는 기대와 함께 - 2023/01 ~ 2023/03, 신년을 맞이하며 호기롭게 인과추론 관련된 스터디를 진행했었다. - 관련해서 인과추론에 대한

gibles-deepmind.tistory.com

- 회사에서 인과추론 스터디를 개설하고 리드했다.

- 운영하는 과정에서 "원인과 결과의 경제학", "고수들의 계량 경제학" 두 권의 책을 읽었는데 어떤 행동(원인)이 있었을 때, 효율적인 결과를 낼 수 있는지에 대해 정량적으로 판단하는 기법들에 대해 배울 수 있었다.

- 다만, 공부를 진행하며 정량적으로 판단하는 기법들 외에도 도메인 영역에 대해 가지고 있는 지식들이 중요하다는 사실을 다시 한번 깨달았다.

- 왜냐하면, 도메인 영역 지식이 풍부한 사람이 낼 수 있는 가설과 그렇지 않은 사람이 낼 수 있는 가설 간에 양적 / 질적인 측면에서 차이가 있기 때문이다.

- 결론적으로 인과추론을 위해서는 기법도 중요하지만, 연구 디자인을 결정할 수 있는 도메인 지식도 무척이나 중요하다.

 


분석의 레슨런 / 조작적 정의


- 데이터 분석가한테 가장 비효율적인 업무가 무엇일까?

- 사람마다 생각이 다르겠지만, 개인적으로는 이전에 진행했던 똑같은 분석을 다시 한번 진행하는 것이라고 생각한다.

- 왜냐하면, 똑같은 결과를 다시 한번 확인하는 경우가 많기 때문이다. 

- 그런데, 왜 똑같은 분석을 다시 한번 진행하는 것일까?

- 지금까지 회사에서 배웠던 내용들을 바탕으로 설명해보면 분석 결과로 부터 얻은 "레슨런"이 명확하지 않아서이다.

- 레슨런이 명확하지 않으면, 혹시 못 본 것이 있지 않을까?라는 의문이 남을 수 밖에 없다.

- 따라서, 분석가는 단순히 분석 결과를 전달하는 것이 아니라 보는 사람이 "어떤 레슨런"을 얻어갈 수 있을지 고심해야 한다.

 

- 이 때, 가장 효율적인 수단은 분석 결과를 "시스템화"하는 것이다. 단순하게는 대시보드 만드는 것이라고도 생각할 수 있다.

- 하지만, 개인적으로는 "서비스"내에 잠재하고 있는 불확실성을 해소하는 것 = 곧 시스템화라고 생각한다.

- 예를 들어, 매출 감소 분석을 진행한다고 해보자. 단순히, 아.. 어느 상품에서 매출이 빠진 것 같아요 라고만 전달을 하게 되면, 비슷한 요청을 지속적으로 받게 될 가능성이 크다.

- 왜냐하면, "매출이 감소한 것"은 이미 모두가 알 고 있는 사실이고 중요한 것은 구체적으로 어떤 고객에서 매출이 감소한 것인지를 알아야 "액션"을 실행할 수 있기 때문이다.

- 이 경우, 고객 유형을 올바르게 정의하면(고객 그룹에 대한 불확실성을 해소) 액션 대상을 명확히 할 수 있어 반복적인 요청에 대해 효율적으로 대응할 수 있게 된다.

 

- 어떤 결과에 대해 사람마다 각자 가지고 있는 "설명 양식"이 존재한다.

- 문제는 이 "설명 양식"이 꽤나 추상적이라는 것이다. 

- 예를 들어, 지금 먹고 살기가 힘든 건 인플레이션 때문이에요. 라는 의문이 있다고 가정하자. 그렇다면, 이때 필요한 것은 정말 인플레이션라는 개념을 측정가능한 방식으로 수치화하고 실제 인플레이션이 있는지 확인하는 것이 우선이다.

- 만약, 이 작업을 제대로 하지 않으면 A한것은 B때문이에요. 근데 그 B가 뭔지 잘모름이라는 굴레에 빠질 수 있다.

- 이렇게 추상적인 개념을 측정가능한 방식으로 변화시키는 것을 심리학에서는 "조작적 정의"라고 표현한다.

- 추상적인 개념을 측정가능한 개념으로 구체화하는 것 또한 업무 효율성을 높여줄 수 있다.

- 왜냐하면, 그 자체만으로도 불확실성을 일정 부분 해소할 수 있기 때문이다.


성대 직무 특강


https://github.com/ddongmiin/sungkyununiv-speech-about-DataAnalyst

 

GitHub - ddongmiin/sungkyununiv-speech-about-DataAnalyst: 비전공 대학원생 분들이 데이터 분석가 지원시 어떻

비전공 대학원생 분들이 데이터 분석가 지원시 어떻게 본인의 강점을 살릴 수 있을지에 대해 성균관대에서 강의를 진행했습니다. - GitHub - ddongmiin/sungkyununiv-speech-about-DataAnalyst: 비전공 대학원생

github.com

- 지난 금요일 성균관대에서 직무 특강을 진행했다.

- 발표 제목은 "내 경험에 매력 한스푼 더하기"라는 주제로 발표를 진행했다. 

- 흔히, 비전공자라고 불리는 전공의 대학원생 분들이 데이터 분석가 직무에 지원할 때 어떻게 본인의 강점을 살릴 수 있을까에 대해 아래 두가지 내용을 위주로 다루었다.

- 가설검정을 위한 실험/인과추론
- 직접 데이터를 수집하여 본인의 가설을 구체화하여 측정하고 검증하는 과정

- Q & A도 한 시간 꽉 채워서 진행됐고, 학생분들께서 감사하다는 말씀을 많이 주셔서 개인적으로도 정말 큰 보람이 있었다.

 


깃헙 포트폴리오 정리


https://github.com/ddongmiin

 

ddongmiin - Overview

Data Analyst. ddongmiin has 10 repositories available. Follow their code on GitHub.

github.com

- 지금까지 진행했던 외부 활동(강의, 발표, 스터디 운영)위주로 깃헙 페이지를 정리했다.

- 하나로 모아두고 보니, 그래도 그 간 나름 이것저것 열심히 해온 것 같아서 뿌듯하다.

- 고정은 6개 밖에 할 수 없으니, 앞으로 더 의미있는 활동을 많이 해서 기존 것들을 밀어 내야겠다.

 


지금까지 저의 23년 상반기 회고에 대한 글이었습니다. 읽어주셔서 감사드립니다. 

블로그의 정보

딥상어동의 딥한생각

딥상어동의 딥한생각

활동하기