분당선 정자역에서 생각해본 데이터 시각화의 단상
딥상어동의 딥한 데이터 처리/시각화2023. 1. 9. 23:48분당선 정자역에서 생각해본 데이터 시각화의 단상

세상이 허락한 유일한 마약... 퇴근....! 그렇다. 나는 출근을 코앞에 둔 K-직장인이다. 점차 다가오는 출근 시간에 잠시 정신을 잃었나보다. 그렇지만, 항상 행복한 퇴근. 나의 퇴근 루트는 아래와 같다. 1. 셔틀을 타고 판교역으로 간다. 그리고, 정자역에서 분당선으로 갈아타서 죽전역에서 내린다. 2. 셔틀을 타고 서현역으로 간다. 그리고, 서현에서 죽전역으로 쭈욱~ 간다. 가장 활발하게 이용하는 루트는 1번이다. 그래서, 정자역에서 분당선으로 갈아타는 길을 자주 지나가게 된다. 정자역 -> 분당선 하행 선로에는 사각지대가 있다. "앞쪽으로 이동하여 주시기 바랍니다" 왜 이걸 보고 사각지대라고 하는거지? 라고 생각할 수 있다. 뜻 먼저 이해해보자. 한 마디로, 여기서 타지 말라는거다. 그런데, 간혹..

[Pandas] 데이터프레임도 이미지로 저장할 수 있다구?
딥상어동의 딥한 데이터 처리/시각화2022. 10. 2. 22:28[Pandas] 데이터프레임도 이미지로 저장할 수 있다구?

핵심내용 1.Pandas에서 데이터프레임을 이미지로 저장하는 방법에 대해서 정리해봅니다. 2.한글과 관련된 이슈를 해결해봅니다. 3.약간의 pandas style을 붙여봅니다. 1~3의 과정을 통해 위와 같은 이미지를 telegram 챗봇으로 보내봅시다. (데이터야놀자 발표를 준비 하는 중에 관련된 내용을 글로 정리하였습니다.) 1.Pandas 데이터프레임을 PNG로 저장하는 방법들 Pandas에서 데이터프레임을 PNG로 저장하는 방법에는 크게 3가지가 있다. (적어도 지금까지 내가 알아본 바로는) 1-1. dataframe-image라이브러리 이용하기 https://pypi.org/project/dataframe-image/ dataframe-image Embed pandas DataFrames as ..

[Boxplot] 박스플롯 이용시 주의사항
딥상어동의 딥한 데이터 처리/시각화2021. 12. 19. 13:23[Boxplot] 박스플롯 이용시 주의사항

최근 글에서 박스플롯을 사용하여 분석 결과를 설명한 적이 있습니다. https://gibles-deepmind.tistory.com/95 [데이터로 보는 주식] 물타기 도대체 언제 할것이냐, 그것이 문제로다. 0. 들어가며 안녕하십니까 파란불 달인 딥상어동입니다. 왜 파란불이라는 말을 썼을까요? 그것은 바로바로. 제 주식 포트 폴리오에 "음봉"이 가득~ 하기 때문인데요. 제 손으로 적기는 정말 슬픕 gibles-deepmind.tistory.com 일단은 시간은 없고.. 글은 빨리 마무리해야하니 박스플롯으로 결과를 설명했었는데요. 결과를 직관적으로 전달하지 못한다는 생각이 들었었습니다. 그리고, 이후 박스 플롯의 어떤 측면 때문에 정보를 직관적으로 전달하기 어려운지에 대해 고민해봤습니다. 1. 장점 - ..

[Pandas] 퍼널차트 데이터프레임으로 표현해보기
딥상어동의 딥한 데이터 처리/시각화2021. 8. 15. 01:31[Pandas] 퍼널차트 데이터프레임으로 표현해보기

0. 퍼널 차트몇 명이나 깔때기를 통과할까?  좌측 퍼널 차트는 얼마나 많은 방문자를 구매자로 전환시킬 수 있을까?에 대한 고민을 담고 있습니다. 이처럼, 퍼널 차트는 "서비스의 목표"와 관련이 있습니다. 대표적인 예로 AARRR 모형(우측)이 있습니다. 1. Acquisition : 유저 유입2. Activation : 첫 활동 (회원가입)3. Retention : 재방문4. Revenue : 서비스 구매5. Referral: 주변인에게 추천 직관적으로, 퍼널 단계가 아래로 갈수록 (= 깔때기가 좁아질수록) 통과 난이도가 어려워진다는 것을 알 수 있습니다. 예를 들어, 현재 서비스의 목표가 "회원가입"이라고 가정합시다. 당연히 유입 유저수 != 회원가입 유저수일 텐데요. 이때, 회원가입까지 이루어지는 ..

Seaborn | countplot(기본 파라미터, x축 정렬하기, x축 라벨 회전)
딥상어동의 딥한 데이터 처리/시각화2021. 3. 7. 18:10Seaborn | countplot(기본 파라미터, x축 정렬하기, x축 라벨 회전)

목차 1. 집계, 그리고 기준 2. countplot이란? 3. 파라미터 확인 1. 집계, 그리고 기준 E나라 지표 기준 2017년 기준 총인구 5,136만명중 남자는 2,574만명, 여자는 2,563만명입니다. 여기에는 두 가지 내용이 포함되어 있습니다. 첫 번째는 "집계"입니다. 여기서는 전체 인구수를 셌습니다(count). 두 번째, 집계 대상입니다. 두 가지 조건이 있는데, 하나는 대한민국 국민이고, 다른 하나는 성별입니다. 집계를 하기 위해서는 항상 기준이 필요합니다. 그리고, 이러한 기준을 "범주"라고 합니다. 범주가 있다면, 범주를 기준으로 집계(종합)를 할 수 있습니다. 예를 들어, "소득"이라는 개념에 대해 생각해봅시다. 소득은 국민 개별로 제 각각 일 것 입니다. 예를 들어, A가 작년..

[Matplotlib] 모두를 위한 Python시각화 - (1)Matplotlib.artist
딥상어동의 딥한 데이터 처리/시각화2021. 1. 3. 18:32[Matplotlib] 모두를 위한 Python시각화 - (1)Matplotlib.artist

matplotlib.org/3.3.3/tutorials/intermediate/artists.html Artist tutorial — Matplotlib 3.3.3 documentation Note Click here to download the full example code Artist tutorial Using Artist objects to render on the canvas. There are three layers to the matplotlib API. the matplotlib.backend_bases.FigureCanvas is the area onto which the figure is drawn the matplotli matplotlib.org (본 글은 Matplotlib 공식 ..

딥상어동의 딥한 데이터 처리/시각화2021. 1. 1. 14:57아카이브 페이지

일단 만들고 본다 시작이 반이다~

image