코호트란?
특정 기간동안 공통된 특성이나 경험을 갖는 사용자 집단. 비즈니스에서는 같은 시기에 제품 및 서비스를 처음 구매한 집단, 비슷한 유형의 제품 및 서비스를 구매하는 고객들의 그룹을 의미한다.
코호트 분석이란?
특정 기간동안 고객이나 사용자 그룹을 기준에 따라 분류하고, 그 그룹의 행동 패턴을 시간에 따라 추적하여 분석하는 기법이다. 이를 통해 시간이 지남에 따라 제품, 서비스, 마케팅 전략 등이 특정 그룹에 어떻게 영향을 미치는지 알 수 있다. 마케팅에서 주로 사용되며 대표적인 툴은 Google Analytics가 있다.
코호트 분석이 중요한 이유
* 고객 유지율 : 고객 유지율, 이탈 패턴 분석 가능
* 제품 개선: 사용자 피드백과 사용 패턴을 바탕으로 제품 및 서비스 분석 가능
* 마케팅 : 캠페인의 성공 여부 확인 가능. 고객을 세분화하여 타겟 마케팅의 효과적 시행 가능
* 예측 : 미래의 소비자 행동에 대해 정확한 예측 가능
(ex. Spotify: 노래 설정, 듣는 시간대, 노래 선호도 등의 사용자 활동 추적 / 에어비앤비 : 시간이 지남에 따라 변하는 사용자 참여도/이탈률 등을 추적)
코호트 분석의 유형
* 전향적 코호트 연구
일반적인 코호트 연구. 특정 시점에 개별 그룹을 모집하고 특정 결과의 발생을 평가하기 위해 전향적으로 추적하는 연구. 연구를 시작할 때 결과가 0인 상태를 기준으로 참가자가 등록되며, 시간이 지남에 따라 특정 결과값이 나왔는지 평가한다. 원인과 결과 사이의 시간적 관계를 설정해야 할 때 선호된다.
- 장점 : 다수의 원인 및 결과 평가 가능 / 원인과 결과 사이 시간적 인과 관계 설정 가능 / 기억 편향에 덜 민감
- 단점 : 시간과 비용이 많이 듦 / 편향이 발생할 수 있음 / 희귀한 결과값을 도출하려면 표본 크기가 커야할 수 있음
* 후향적 코호트 연구
관심 위험 요인에 이미 노출된 개별 그룹을 특정 시점에 식별하고, 결과가 발생한 이유를 알고자 과거를 추적하는 연구. 윤윤리적/물리적 이유로 전향적 연구를 수행할 수 없을 때 유용하다. 또한 관심 결과가 연구 모집단에서 이미 발생했으며, 새로운 사례가 발생하기를 기다리는 것이 불가능할 때 유용하다. 원인과 결과 사이의 연관성에 대한 평가가 빠르고 비용 효율적인 필요가 있을 때 선호된다.
- 장점 :비교적 빠르고 저렴 / 희귀한 결과 연구 가능 / 위험 요인과 결과 사이의 연관성 평가에 짧은 기간 소요 가능
- 단점 : 편향(선택 편향/회상 편향)의 경향 / 시간적 인과관계가 불완전할 수 있음
* 시간 기반 코호트 (Time Cohort)
고객이 서비스에 가입한 시간, 제품을 처음 구매한 시간 등 시간 기준의 그룹화
ex) 매월 새로운 사용자 그룹을 분석하여 첫 구매 후 일정 기간 동안의 재구매율 측정
* 행동 기반 코호트 (Behavior Cohort)
사용자의 특정 행동이나 이벤트(예: 앱 내 구매, 특정 기능 사용 등)를 기준으로 그룹화
ex) 특정 캠페인을 본 후 구매한 고객들의 그룹을 분석하여 캠페인의 효과를 평가
* 크기 기반 코호트 (Size Cohort)
그룹의 상대적 크기를 기준으로 분류
ex) 특정 기간 동안 가입한 사용자 수를 기준으로 그룹을 나누고, 그룹별 행동을 비교
예시
예를 들어 아래와 같이 사업 시작 후 4개월 매출 현황이 있다고 가정한다.
1월 | 2월 | 3월 | 4월 | |
전체 고객 (명) | 1,000 | 2,000 | 3,000 | 4,000 |
고객 당 평균 매출 | 50,000 | 45,000 | 43,300 | 45,000 |
고객 당 평균 매출이 소폭 감소한 후 상승하는데, 위 표를 통해서는 상황이 좋아지는지 나빠지는지 정의하기 어렵다.
아래 표는 같은 데이터를 고객의 가입 시기에 따라 나누어 표를 다시 그린 것이다.
코호트 | 볼륨 | 1개월 | 2개월 | 3개월 | 4개월 |
1월 가입자 | 1,000 | 50,000 | 30,000 | 20,000 | 10,000 |
2월 가입자 | 1,000 | 60,000 | 40,000 | 20,000 | |
3월 가입자 | 1,000 | 70,000 | 60,000 | ||
4월 가입자 | 1,000 | 80,000 | |||
평균 | 1,000 | 70,000 |
위 표를 통해서는 다양한 분석을 할 수 있다. 매월 신규 가입자의 수, 매월 신규로 가입한 고객의 첫 달 평균 구매액의 차이, 월별 가입자들의 시간에 따른 평균 구매액 변화 등 시간의 흐름에 따라 파악할 수 있는 것들이 보인다.
전체 고객 당 평균 매출 표에서는 매출액 변화가 정적인 것처럼 보이지만, 시기에 따라 표를 나누면 고객들의 첫 달 구매액이 증가하고 있으며 월별 구매액의 감소폭이 개선되고 있다는 것을 알 수 있다.
이와 같이 코호트 분석을 이용하면 매출, 유지율, 바이럴 효과, 이탈율 등을 분석할 수 있게 된다.
+) 참고 링크 : https://datarian.io/blog/cohort-analysis