평균으로의 회귀, 그리고 변수 통제
딥상어동의 딥한 통계학2023. 2. 5. 01:54평균으로의 회귀, 그리고 변수 통제

본 글은 "고수들의 계량경제학"을 참고하여 작성하였습니다. 1. 평균으로의 회귀 비트코인 랠리 평균가 회귀 번스타인 비트코인 랠리는 평균가 회귀 현상한계 분명해 | 한국경제TV (wowtv.co.kr) 💡 비트코인이 미국 연방준비제도(Fed·연준)의 금리인상 속도 조절 기대감에 상승세를 이어가고 있는 가운데 글로벌 IB(투자은행) 번스타인이 비트코인 상승 랠리의 허점을 지적하고 나섰다. 23일(현지시간) CNBC에 따르면 번스타인은 "비트코인 상승 랠리가 장기적인 평균 가격으로 돌아가는 일시적인 반등에 불과하다"면서 "상승 랠리를 유지하기 위한 근본적인 동력이 부족하다"고 밝혔다. 이날 고탐 추가니(Gautam Chhugani) 번스타인 애널리스트는 고객들에게 보낸 서한에서 최근 암호화폐 시장에서 나타나..

[Bigquery] 지난 며칠 간 Python과 연동하여 사용한 소감
딥상어동의 딥한 프로그래밍/엔지니어링2023. 1. 18. 00:56[Bigquery] 지난 며칠 간 Python과 연동하여 사용한 소감

지난 며칠 간 빅쿼리를 파이썬과 연동해서 사용하였다. pip install google-cloud-bigquery 파이썬과 연동해서 사용하기 위해서는 Client 객체를 사용해야 한다. 공식 Documnet에서 Client 인스턴스에서 사용할 수 있는 method 목록을 확인할 수 있다. https://cloud.google.com/python/docs/reference/bigquery/latest/google.cloud.bigquery.client.Client#google_cloud_bigquery_client_Client_query Class Client (3.4.0) | Python client library | Google Cloud Send feedback Class Client (3.4.0) ..

가설검정과 무작위 실험 그리고 선택 편향
딥상어동의 딥한 통계학2023. 1. 14. 21:25가설검정과 무작위 실험 그리고 선택 편향

- 본 글에서는 가설검정의 논리와 무작위 실험이 필요한 이유, 그리고 선택 편향에 대해서 다룹니다. - P-value등 통계적인 개념에 대해서는 깊게 다루지 않습니다. 1. 가설검정 1-1. P-value와 영가설 - 연구자들은 P-value하나에 울고 웃는다. - P-value가 0.05미만인 것을 왜 이렇게 좋아할까? 왜냐하면 영가설을 기각할 수 있기 때문이다. 1-2. 영가설이란? - P-value는 “0.05미만이면 기분이 너무 좋다!” 정도로만 기억하고, 영가설(NULL HYPOTHESIS)이 무엇인지 알아보자. - 여기서, 우리에게 친숙한 단어가 있다. 바로, “NULL” “NULL”은 “값이 없음”을 의미한다. → 즉, 영가설이란 = 가설이 없는 상태를 의미한다. 가설이 없다는 것은 다른 의..

전략적 사고 - 스타크래프트의 추억
나라는 존재/생각2023. 1. 14. 03:10전략적 사고 - 스타크래프트의 추억

실생활에서 우리는 전략이라는 단어를 자주 사용한다. "전략적 사고가 필요하다"라는 말을 사용하기도 하고, "전략"이 유효했다라는 말을 하기도 한다. 사전에는 아래와 같이 표기되어 있다. 1. [군사 ] 전쟁을 전반적으로 이끌어 가는 방법이나 책략. 전술보다 상위의 개념이다. 2. 정치, 경제 따위의 사회적 활동을 하는 데 필요한 책략. 이끄는 방법, 책략 정도로 표현하고 있다. 하지만, 이것만으로 "전략"이라고 표현을 하기에는 직관적이지 않다. 어떻게 표현해야 할까? 여기에 대한 대답을 "내쉬의 균형이론"에서 찾을 수 있다. 균형이론의 결과는 "균형"을 찾는 것이다. 그렇다면, 균형은 어떻게 찾을 수 있을까? 그전에 내쉬의 균형이론은 게임이론이다. 게임이란 무엇인가? 온라인 게임? PC게임? 모바일 게임..

주인장 소개
나라는 존재/생각2023. 1. 14. 01:41주인장 소개

주인장 이력안녕하세요. 상담이 하고 싶어 심리학과에 진학했지만, 정작 연구방법론이라는 수업에서 실험을 통해 추상적인 생각을 정량화 하며 데이터 분석에 빠졌습니다. 그리고, 현재는 넥슨이라는 게임 회사에서 약 5년간 데이터 분석가로 일하고 있습니다.저는 아래와 같은 일들을 해왔고, 하고 있습니다!- 다수의 유관 부서가 참여하는 회의에서 1~2주 단위로 분석 주제 조율 및 인사이트 제공, 데이터 전처리 / 문제 정의 / 분석 인사이트 도출 / 액션아이템 제시까지 전반적인 과정 리딩- 고객 경험에 대한 맥락 정보를 추론할 수 있는 다수의 유저 세그멘테이션 설계 및 지표 관리- 추상적인 현상에 대한 정량화 및 지표 이상 탐지- 복잡한 현상을 직관적으로 표현할 수 있는 대시보드 구축 및 관리- 다량의 ETL ..

분당선 정자역에서 생각해본 데이터 시각화의 단상
딥상어동의 딥한 데이터 처리/시각화2023. 1. 9. 23:48분당선 정자역에서 생각해본 데이터 시각화의 단상

세상이 허락한 유일한 마약... 퇴근....! 그렇다. 나는 출근을 코앞에 둔 K-직장인이다. 점차 다가오는 출근 시간에 잠시 정신을 잃었나보다. 그렇지만, 항상 행복한 퇴근. 나의 퇴근 루트는 아래와 같다. 1. 셔틀을 타고 판교역으로 간다. 그리고, 정자역에서 분당선으로 갈아타서 죽전역에서 내린다. 2. 셔틀을 타고 서현역으로 간다. 그리고, 서현에서 죽전역으로 쭈욱~ 간다. 가장 활발하게 이용하는 루트는 1번이다. 그래서, 정자역에서 분당선으로 갈아타는 길을 자주 지나가게 된다. 정자역 -> 분당선 하행 선로에는 사각지대가 있다. "앞쪽으로 이동하여 주시기 바랍니다" 왜 이걸 보고 사각지대라고 하는거지? 라고 생각할 수 있다. 뜻 먼저 이해해보자. 한 마디로, 여기서 타지 말라는거다. 그런데, 간혹..

쇼미더머니와 함께 한 12월 그리고 2022년 회고
나라는 존재/생각2022. 12. 30. 20:50쇼미더머니와 함께 한 12월 그리고 2022년 회고

역순으로 해보는 2022년 회고 Start 12월 12월은 재벌집 막내아들과 쇼미더머니에 푹 빠져서 보냈다. 그렇게 끝나지 않을 것 같던 재벌집 막내아들이 끝나며, 2023년도 어느덧 성큼 앞으로 다가왔다. 대표 장수 음악 경연 프로그램 쇼미더머니. 로꼬가 더블케이와 Home이라는 곡으로 우승했던 때가 엊그제 같은데 벌써 시즌 11까지 와버렸다. 그리고, 시즌 11에서 나의 마음을 사로잡은 한 명의 래퍼가 있으니... 바로 QM...! #scene1. - 팀 크루 미션 앞 순서 팀원이 가사를 모두 절었고, 박자까지 밀렸음에도 불구하고 다시 박자를 잡고 랩을 진행하는 모습이 인상깊었다. 덕분에, 마지막 팀원까지 안정적으로 랩을 마친 것은 덤 #scene2.- 디스전 이번 시즌 최고의 디스전. 이거 하려고 ..

관계형 데이터베이스와 NOSQL 비교
일일아이티 일일데분2022. 12. 11. 00:37관계형 데이터베이스와 NOSQL 비교

핵심내용 데이터베이스는 일종의 창고라고 볼 수 있다. 그리고, 이 창고에는 데이터들이 저장되어 있고 저장되어 있는 데이터들이 모여 데이터의 집합을 이룬다. 어떤 물품(데이터)를 저장할지에 따라 사용하는 창고(DB)의 종류가 달라지고 이는 관리자가 결정한다. 오늘은 이 창고들 중 관계형 데이터베이스와 NoSQL을 비교해보려 한다. 관계형 데이터베이스 데이터베이스계의 주류는 뭐니뭐니해도 관계형 데이터베이스이다. 위 통계를 살펴보면 가장 인기있는 데이터베이스 5개중 4개가 관계형 데이터베이스이다(Oracle, MySQL, SQL Server, PostgreSQL). 관계형 데이터베이스에서 "관계"란 동일한 속성을 가지고 있는 데이터들의 집합이라고 할 수 있다. 예를 들어, 아래 표를 살펴보자. 번호 이름 성별..

[네트워크] 패킷과 라우터
일일아이티 일일데분2022. 12. 10. 13:11[네트워크] 패킷과 라우터

핵심내용 패킷과 라우터에 대해서 간단하게 정리해보려고 한다. 패킷 두개 이상의 연산 장비들이 연결된 것을 네트워크라고 한다. 그리고, 연결된 연산 장비들은 서로 데이터를 주고 받는데 이 때 이 데이터를 그냥 주고 받지 않고 패킷이라는 단위로 쪼개서 주고 받는다. 왜 쪼개서 받는가? 하나의 장비와 다른 장비가 정보를 주고 받는 대역을 도로에 비유해보자. 문제는 이 도로를 나만 사용하는 것이 아니라는 것이다. 나 말고, 다른 사람들도 사용한다. 그렇기 때문에 데이터를 패킷 단위로 쪼개어 주고 받는 것이다. 다시, 패킷은 네트워크 전송 시 기본이 되는 용량 단위로 컴퓨터는 네트워크 상에서 하나의 데이터를 여러 패킷으로 쪼개서 전송한다. 라우터(router) 그전에 routing이 무엇인지 알아야 한다. 컴퓨터..

[도커] 컨테이너 삭제
딥상어동의 딥한 프로그래밍/엔지니어링2022. 12. 8. 22:51[도커] 컨테이너 삭제

핵심내용 도커 컨테이너를 정리하는 방법에 대해서 다루고자 한다. 일단 정지용 도커 컨테이너를 삭제하기 전에 우선, 도커를 먼저 정지해야 한다. 왜냐하면, stop후 삭제하는 과정을 통해 삭제하는데 필요한 충분한 시간을 벌 수 있기 때문이다. (다만, 정지를 하지 않고도 삭제를 강제할 수 있기는 하다.) 그래서, 컨테이너를 삭제하기 전에 도커를 먼저 정지해야 한다. 1. 하나의 컨테이너를 정지하는 경우 docker stop [OPTIONS] CONTAINER [CONTAINER...] 컨테이너 아이디나, 혹은 이름을 넣어준다. 2. 여러개의 컨테이너를 정지하는 경우 docker stop container1 container2 컨테이너 이름이나 아이디를 띄어쓰기로 입력해준다. 3. 특정 이미지와 연관된 모든..

image