핵심 내용
실무에서 유저 세그먼트라는 용어를 실제로 많이 사용하기도 하고, 정의하기도 합니다. 이번 글에서는 유저 세그먼트를 나누는 과정에서 고민했던 부분들을 남겨보려 합니다.
세그먼트란?
유저 세그먼트란 무엇일까요? MBTI도 유저 세그먼트의 일종이라고 할 수 있습니다. 왜냐하면, 질문지에 대한 답변을 기준으로 사람들을 16가지 유형으로 나눴기 때문입니다. 아무렇게나 나눈다고 세그먼트가 될까요? 그건 아닙니다. 어느 정도는 동질성이 보장되어야 합니다. 서로 다른 MBTI 유형들을 비교할 수 있는 이유는 동일한 검사지를 사용했기 때문입니다. 이렇게 동질성을 가지고 있는 집단을 흔히, 코호트라고 합니다.
세그먼트 뭣이 중한디?
왜 세그먼트가 중요할까요? 그 이유는 기업에서는 사용자가 특정 행동을 하기를 원하고, 그렇기 때문에 특정 행동을 하도록 유도하기 때문입니다. 예를 들어, 3천원 쿠폰을 주는 이벤트를 진행했다고 가정합시다. 여기서 우선 두 가지 세그먼트를 만들 수 있습니다.
세그먼트 | 설명 |
A | 3천원 쿠폰을 사용한 그룹 |
B | 3천원 쿠폰을 사용하지 않은 그룹 |
이렇게 보통은 서비스 내에서 유저가 할 수 있는 행동을 기준으로 세그먼트를 구분합니다. 그렇다면, 이렇게 두 가지로 나누면 끝일까요?
단일 세그먼트의 함정
그런데, A세그먼트의 유저들 중 3천원 쿠폰을 굳이 주지 않았어도 물건을 구매 했을 유저들은 얼마나 될까요? 즉, 유저가 서비스에 대해 기본적으로 가지고 있는 "관여도"를 고려해야 합니다. 상식적으로 생각해 봤을 때, B세그먼트보다는 A세그먼트에 "기존 구매 유저"가 포함되어 있을 가능성이 높습니다. 즉, A세그먼트는 원래 구매 성향이 높았던 유저군이었기 때문에 3천원 쿠폰 이벤트에 반응했을 수 있습니다. 이렇게 유저를 두 유형으로만 나눠서 보게되면 효과를 과대 혹은 과소 추정할 수 있습니다. 그렇다면, 세그먼트를 어떻게 나누는게 좋을까요?
세그먼트 함정 피하기
휴먼 유저 제외하기
첫 번째 방법은 휴먼 유저를 제외하는 것입니다. 서비스마다 다르겠습니다만, 보통 장기 휴먼 유저의 경우 복귀율이 낮습니다. 이러한 장기 휴먼 유저를 분석에서 제외하지 않으면, 마치 이벤트의 효과가 매우 높은 것 같은 착시 현상을 맛볼 수 있습니다. 그렇다면, 휴먼 유저는 어떻게 제외할 수 있을까요? 가장 간단한 방법은 최근 접속일을 살펴 보는 것입니다. 예를 들어, 이번 분석에는 최근 일주일/한달 이내에 접속한 유저만 살펴본다와 같은 기준을 설정할 수 있습니다. 이렇게 최근 접속일을 기준으로 조건을 걸게되면 최근 일주일/한달 이내에 접속 기록이 없는 유저들은 자동으로 제외됩니다.
이중 세그먼트 활용하기
MECE란 "상호 배타적이면서 전체를 포괄한다" 라는 의미입니다. 이런 관점에서 봤을 때, 세그먼트A와 세그먼트B를 완전히 배타적이라고 볼 수 있을까요? 반은 맞고 반은 틀리다고 할 수 있습니다.
세그먼트(가)
세그먼트 | 설명 |
A | 3천원 쿠폰을 사용한 그룹 |
B | 3천원 쿠폰을 사용하지 않은 그룹 |
만약, 결제 이력이 있는지도 중요한 기준이라고 생각해봅시다.
세그먼트(나)
3천원 쿠폰 사용 | 3천원 쿠폰 미사용 | |
결제 이력 있음 | A | B |
결제 이력 없음 | C | D |
이렇게 나눠서 봤을 때, 어디에 관심을 가질 수 있을까요? 만약 세그먼트B와 세그먼트C에 포커스를 둔다면 각각에 대해 다음과 같은 고민들을 해볼 수 있습니다.
세그먼트B - 예전에 결제 하던 유저인데 왜 안쓰지? (혹시, 특정 시점이후로 결제를 하지 않았나? 아니면, 쿠폰 적용 상품이 기존 구매 상품과 달라서인가?)
세그먼트C - 오.. 신규 결제 유저가 사용했네 처음 산 상품은 뭐지? / 기존 첫구매 유저랑은 어떤 차이가 있지?
만약, 세그먼트(가)를 기준으로 유저를 살펴봤다면 하지 못했을 고민입니다. 그래서, 저는 개인적으로 단일 세그먼트 보다는 이중 세그먼트를 선호하는 편입니다.
세그먼트 기준은 어떻게 설정하는게 좋을까?
이건 정답은 없습니다. 왜냐하면, 그 가짓수가 너무 많기 때문인데요. 서비스에 대한 이해도가 가장 중요하다고 말씀드리고 싶습니다. 왜냐하면, 세그먼트를 나누는 가장 좋은 기준은 "유저가 서비스 내에서 할 수 있는 의미있는 행동"이기 때문입니다. 99와 100, 101 세 숫자를 비교해봅시다. 100을 기준으로 나누기에는.. 1차이 밖에 안나서 뭔가 애매하죠? 99/100/101 모두 비슷해 보입니다. 하지만, 서비스 내에서 어떤 행동을 100번 하면 5천원 쿠폰을 준다고 가정합시다. 그러면, 99와 100은 산술적인 차이 1보다 훨씬 큰 차이를 지니게 됩니다. 왜냐하면, "서비스 내에서 할 수 있는 의미있는 행동"이라는 추가적인 의미가 부여됐기 때문이죠.
개인적으로 생각 했을 때, 세그먼트 분석 시 가장 노답인 상황은 "서비스에 대한 이해도 없이 클러스터링 알고리즘을 사용하는 경우"라고 생각하는데요. 물론, 클러스터링은 유용한 알고리즘이기는 합니다만 "서비스에 대한 이해도"가 없으면 군집에 대한 의미를 부여할 수 없습니다. PCA를 이용해서 변수를 3개로 압축하고 K-means알고리즘을 이용해 5개의 군집을 만들었더니 실루엣 계수가 1에 근접하게 나왔습니다..! 라는 말을 들으면 현업에서는 뭐라고 생각할까요? 솔직히 할말이 없지 않을까요? 이런 분석은 실무에 도움을 주기 어렵습니다. (군집분석이 의미없다는 뜻은 절대 아닙니다 K-means는 매우 유용한 알고리즘입니다.)
어쨌든, 세그먼트를 잘 나누기 위해서는 서비스에 대한 이해도를 높여야 합니다. 그리고, 그 이해도를 바탕으로 유저가 서비스 내에서 할 수 있는 의미있는 행동에 대해 정의를 해야 합니다. 여기서, "의미있는 행동"에 대한 정의도 추상적으로 느껴질 수 있습니다. 이왕이면, 잔존율과 관련이 있으면 좋겠죠. 아니면, 서비스 기획 의도와도 관련이 있을 수 있습니다. 서비스에 애정이 없다면 고민하기 어려운 부분입니다.
마무리하며
프로덕트 분석에 대한 관심이 많아지면서, 관련된 글이나 강의 그리고 질문들도 종종 올라오는 것 같습니다. 만약, 유저세그먼트(=코호트)를 만든다면 본인이 만든 세그먼트에 대해서 "설명"을 할 수 있어야 한다는 점을 말씀 드리고 싶네요. 그리고, 그 설명은 반드시 "서비스 내에서 유저가 할 수 있는 의미있는 행동"과 이어져야 합니다. 읽어주셔서 감사합니다.
Ref.
'분석 논리|전략' 카테고리의 다른 글
중고나라 데이터로 해보고 싶은 것 (0) | 2022.02.26 |
---|---|
[데이터로 생각해보기] 무신사! 결제 직전까지 갔던 상품 목록은 따로 남겨주면 안될까? (2) | 2021.12.16 |
[데이터로 생각해보기] 콴다에 프리미엄 멤버십 도입해보기 (0) | 2021.11.20 |
[데이터로 생각해보기] 콴다 프리미엄 서비스 매출 극대화 방안 고민 (0) | 2021.11.13 |
[데이터로 생각해보기] 배달의 민족 UI 개선 방향을 도출할 수 있는 지표 선정 (0) | 2021.11.04 |
제 블로그에 와주셔서 감사합니다! 다들 오늘 하루도 좋은 일 있으시길~~
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!