[Python] Dot.점 의 의미
딥상어동의 딥한 프로그래밍/Python2022. 2. 6. 13:23[Python] Dot.점 의 의미

Python에서 dot/점/. 의 의미를 알아보자. 0. 객체의 메서드, 속성에 접근 Python과 같은 프로그램을 객체 지향형 프로그래밍이라고 합니다. 데이터 분석을 위해 가장 자주 사용하는 패키지인 Pandas를 예시로 들어보겠습니다. import pandas as pd test_data = pd.DataFrame([[1, 2, 3], [3, 4, 5]], columns=['A', 'B', 'C']) test_data.info() test_data는 판다스라는 클래스의 데이터프레임 객체입니다. 이를, object instance라고 합니다. 이 객체에는 여러가지 속성과 메서드들이 있습니다. 메서드는 일종의 함수 기능이라고 생각하면 됩니다. 예를 들어, info()는 데이터프레임 객체에 있는 컬럼들의 ..

[Python] np.where을 이용하여 두 개의 데이터프레임 전체를 비교하기
딥상어동의 딥한 데이터 처리/전처리2022. 1. 23. 13:37[Python] np.where을 이용하여 두 개의 데이터프레임 전체를 비교하기

0. 비교 조건 1. 데이터 프레임 전체 원소들을 비교할 것 2. 벡터 연산을 사용할 것 3. 두 데이터 프레임의 Shape과 행/열 인덱스읠 배열 순서는 동일하다고 가정할 것 1. 비교 목표 두 개의 데이터프레임 전체를 비교하고 각 원소별로 minimum한 값을 리턴한다. 2. 코드 설명 1. 우선, 동일한 shape의 두 데이터 프레임 객체를 만들어 준다. import pandas as pd import numpy as np d1 = pd.DataFrame() d2 = pd.DataFrame() d1['a1'] = np.random.randint(1, 100, 10) d1['a2'] = np.random.randint(1, 100, 10) d1['a3'] = np.random.randint(1, 10..

[지수함수] - 우리가 코로나 확진자 수에 놀라는 이유
딥상어동의 딥한 데이터 처리/해석2022. 1. 18. 22:43[지수함수] - 우리가 코로나 확진자 수에 놀라는 이유

0. 들어가며 2019.11.17 코로나19가 우리의 일상을 덮쳤다. 하지만, 한동안은 코로나19 이슈에도 불구하고 비교적 잠잠했었는데 그 이유는 2020년 3월 이후 한동안은 확진자 수가 100명 아래였기 때문이다. http://www.dt.co.kr/contents.html?article_no=2020052902109919607024&ref=naver "절대 K방역 못따라간다"...영국의학저널의 `절규` ˝영국은 한국의 코로나19 접근법을 따라가기 어려울 것이다. 앞으로도.˝1840년에 창.. www.dt.co.kr (위풍당당했던 K방역) 한국의 코로나 방역을 극찬하는 2020년 5월의 기사다. 물론, 지금도 영국에 비해서는 훨씬 적은 편이다. (영국은 작년 연말 이후 확진자가 10만명 이상으로 늘어..

[Jupyter notebook] 주피터 노트북에서 폴더 이동하기
딥상어동의 딥한 프로그래밍/엔지니어링2022. 1. 13. 01:18[Jupyter notebook] 주피터 노트북에서 폴더 이동하기

0. 주피터 노트북에서 폴더를 이동하는 이유 데이터 분석을 하기 위해서는 데이터를 불러와야 하는데, 가장 간단한 방법은 로컬 폴더에 데이터를 저장해두고 로컬의 주소를 참조해서 데이터를 불러오는 방식이다. 내가 참조하고자하는 폴더에 어떤 데이터가 있는지 궁금할 수 있다. 이때, 주피터 노트북 내에서 폴더 주소를 이동하여 데이터를 확인할 수 있다. 1. !와 %의 차이 폴더 주소를 이동하는 명령어를 cd라고 한다. 위와 같이 동작한다. 참고) cd .. 를 입력하면 이전 주소로 돌아간다. 동일한 명령어를 jupyter notebook 내에서도 실행해볼 수 있다. 명령어는 동일하나 명령어 앞의 특수문자에 차이가 있다. ! VS % 현재, 내 jupyter notebook이 실행되고 있는 로컬 주소이다. !cd..

딥상어동의 딥한 통계학2022. 1. 4. 21:53다중공선성에서 tolerance의 의미 - 해석의 용이성

https://gibles-deepmind.tistory.com/9 [통계학] 다중공선성에 대한 고찰 - 해석과 모델 성능의 관점에서 1. 어디로 가야하오? 다중공선성을 만난 우리들 본 글에서는 "어디로 가야하오" 에 담긴 두 가지 의미를 다룰 것이다. 다중공선성을 꼭 파악해야하는가? 반드시 해결해야하는 문제인가? 글 개요 gibles-deepmind.tistory.com 일전에 다중공선성에 대해서 다룬적이 있었다. 보통, 다중공선성을 VIF를 통해 판단하고는 하는데 VIF는 1/(1-$R^2$) 로 표현된다. 여기서, $R^2$를 계산하는 방식에 대한 이해가 중요하다. 흔히, $R^2$가 높으면 종속변수 Y에 대한 설명력이 높다고 한다. 하지만, X4를 종속변인(Y)라 생각하고 X1, X2, X3를 각..

print("Hello 2022!") 12월은 회고의 계절
나라는 존재2021. 12. 31. 00:37print("Hello 2022!") 12월은 회고의 계절

고등학생 때는 23살 정도만 되도 되게 어른스러워보였다. 하지만, 23살의 나는 그저 초코파이를 좋아하는 군인이었을뿐... 전혀 어른스럽지 않았다. 그래도 전역만 한다면....! 전역만 한다면....! 전역만 한다면.....! 뭔가 할 수 있을줄 알았것만 여젼히, 나는 세상물정 모르는 햇병아리에 불과했다. 그래도, 30살에는 취업을 해야지! 라는 나름의 마지노선은 있었는데, 정말 간당 간당하게 30살이 되기 직전에 참... 아주... 매우... 운이 좋게도 취업을 했다. 그렇게, 20대가 끝나고, 30대가 찾아왔다. 30대가 찾아온지 며칠 되지도 않은것 같은데 벌써 회고의 계절 12월이 찾아와 버렸다. 30살의 나는 나름... 계획이 있었다. 정말 부끄럽기는 하다만(이불킥각) ㅋㅋㅋㅋ 아래 내용은 이번년..

[VSCode] 기본 터미널 cmder로 설정하기
딥상어동의 딥한 프로그래밍/엔지니어링2021. 12. 27. 22:34[VSCode] 기본 터미널 cmder로 설정하기

VSCODE에서 CMDER를 기본 터미널로 설정하는 방법입니다. 몇 가지 방법을 따라 했으나, Root 주소 설정이 제대로 안되어 방법을 정리합니다. 1. VSCODE에서 환경설정 클릭 2. settings.json 파일 오픈 3. 환경 설정 코드 추가 "terminal.integrated.profiles.windows": { "Cmder": { "path": "${env:windir}\\System32\\cmd.exe", "args": ["/k", "CMDER폴더주소\\bin\\vscode_init.cmd"] } }, "terminal.integrated.defaultProfile.windows": "Cmder"

[Pandas] 판다스에서 SQL 윈도우 함수 사용해보기
딥상어동의 딥한 데이터 처리/전처리2021. 12. 27. 19:44[Pandas] 판다스에서 SQL 윈도우 함수 사용해보기

0. SQL 윈도우 함수란? Window functions operate on a range of rows, defined by the OVER clause. It is like you are looking through the window, you see sky, star, moon. You are not seeing the whole sky, you see part of the sky. Window 함수 이름의 유래에 대해 찾아봤습니다. "창 을 통해 밖을 바라보면 하늘의 부분만을 볼 수 있다". 윈도우 함수의 기본적인 개념입니다. 여기서 창 = 한 행 이라고 생각하시면 됩니다. 즉, 윈도우 함수는 Group By의 결과를 한 행(각 Window)마다 뿌려주는 함수라고 할 수 있습니다. GroupBy..

[Boxplot] 박스플롯 이용시 주의사항
딥상어동의 딥한 데이터 처리/시각화2021. 12. 19. 13:23[Boxplot] 박스플롯 이용시 주의사항

최근 글에서 박스플롯을 사용하여 분석 결과를 설명한 적이 있습니다. https://gibles-deepmind.tistory.com/95 [데이터로 보는 주식] 물타기 도대체 언제 할것이냐, 그것이 문제로다. 0. 들어가며 안녕하십니까 파란불 달인 딥상어동입니다. 왜 파란불이라는 말을 썼을까요? 그것은 바로바로. 제 주식 포트 폴리오에 "음봉"이 가득~ 하기 때문인데요. 제 손으로 적기는 정말 슬픕 gibles-deepmind.tistory.com 일단은 시간은 없고.. 글은 빨리 마무리해야하니 박스플롯으로 결과를 설명했었는데요. 결과를 직관적으로 전달하지 못한다는 생각이 들었었습니다. 그리고, 이후 박스 플롯의 어떤 측면 때문에 정보를 직관적으로 전달하기 어려운지에 대해 고민해봤습니다. 1. 장점 - ..

[데이터로 생각해보기] 무신사! 결제 직전까지 갔던 상품 목록은 따로 남겨주면 안될까?
분석 논리|전략2021. 12. 16. 17:39[데이터로 생각해보기] 무신사! 결제 직전까지 갔던 상품 목록은 따로 남겨주면 안될까?

본 글은 힙한 데이터의 비밀 8주차 마지막 과제 제출 글입니다. - 서비스의 PainPoint 찾기 / 관련 지표 설정 / 가장 중요한 지표 선정 / 지표 상승 방안 0. 들어가며 때는 2015년 2월, 옷 잘입는 군대 후임의 추천으로 무신사에 가입했다. 그리고, 지금까지 7년 동안 옷은 무신사에서만 구매했었다. 최근에 알게 된 사실인데, 무신사의 뜻은 무진장 신발 사진 많은 곳 이라고 한다. 무진장 신발 사진 많은 곳이 지금은 MAU 400만(2021년 9월 기사 참조) 이상의 대형 커머스 사이트로 성장했다. 어쨌든, 오늘은 내가 제일 😍 애정하는 서비스인 무신사 스토어에 대해서 다루어보려고 한다. 1. 장바구니 이탈률과 고객 결제 전환률 장바구니 단계에서 이탈하는 경우를 장바구니 이탈이라고 한다. 산..

image