데이터 분석

코호트 분석(Cohort Analysis)

jsys 2024. 4. 11. 00:31

코호트란?

특정 기간동안 공통된 특성이나 경험을 갖는 사용자 집단. 비즈니스에서는 같은 시기에 제품 및 서비스를 처음 구매한 집단, 비슷한 유형의 제품 및 서비스를 구매하는 고객들의 그룹을 의미한다.

 

 

 

 

코호트 분석이란?

특정 기간동안 고객이나 사용자 그룹을 기준에 따라 분류하고, 그 그룹의 행동 패턴을 시간에 따라 추적하여 분석하는 기법이다. 이를 통해 시간이 지남에 따라 제품, 서비스, 마케팅 전략 등이 특정 그룹에 어떻게 영향을 미치는지 알 수 있다. 마케팅에서 주로 사용되며 대표적인 툴은 Google Analytics가 있다.

 

 

 

 

코호트 분석이 중요한 이유

* 고객 유지율 : 고객 유지율, 이탈 패턴 분석 가능

* 제품 개선: 사용자 피드백과 사용 패턴을 바탕으로 제품 및 서비스 분석 가능

* 마케팅 : 캠페인의 성공 여부 확인 가능. 고객을 세분화하여 타겟 마케팅의 효과적 시행 가능

* 예측 : 미래의 소비자 행동에 대해 정확한 예측 가능

(ex. Spotify: 노래 설정, 듣는 시간대, 노래 선호도 등의 사용자 활동 추적 / 에어비앤비 : 시간이 지남에 따라 변하는 사용자 참여도/이탈률 등을 추적)

 

 

 

 

코호트 분석의 유형

* 전향적 코호트 연구

일반적인 코호트 연구. 특정 시점에 개별 그룹을 모집하고 특정 결과의 발생을 평가하기 위해 전향적으로 추적하는 연구. 연구를 시작할 때 결과가 0인 상태를 기준으로 참가자가 등록되며, 시간이 지남에 따라 특정 결과값이 나왔는지 평가한다. 원인과 결과 사이의 시간적 관계를 설정해야 할 때 선호된다.

- 장점 : 다수의 원인 및 결과 평가 가능 / 원인과 결과 사이 시간적 인과 관계 설정 가능 / 기억 편향에 덜 민감

- 단점 : 시간과 비용이 많이 듦 / 편향이 발생할 수 있음 / 희귀한 결과값을 도출하려면 표본 크기가 커야할 수 있음

 

* 후향적 코호트 연구

관심 위험 요인에 이미 노출된 개별 그룹을 특정 시점에 식별하고, 결과가 발생한 이유를 알고자 과거를 추적하는 연구. 윤윤리적/물리적 이유로 전향적 연구를 수행할 수 없을 때 유용하다. 또한 관심 결과가 연구 모집단에서 이미 발생했으며, 새로운 사례가 발생하기를 기다리는 것이 불가능할 때 유용하다. 원인과 결과 사이의 연관성에 대한 평가가 빠르고 비용 효율적인 필요가 있을 때 선호된다.

- 장점 :비교적 빠르고 저렴 / 희귀한 결과 연구 가능 / 위험 요인과 결과 사이의 연관성 평가에 짧은 기간 소요 가능

- 단점 : 편향(선택 편향/회상 편향)의 경향 / 시간적 인과관계가 불완전할 수 있음

 

 

 

* 시간 기반 코호트 (Time Cohort) 

고객이 서비스에 가입한 시간, 제품을 처음 구매한 시간 등 시간 기준의 그룹화

ex) 매월 새로운 사용자 그룹을 분석하여 첫 구매 후 일정 기간 동안의 재구매율 측정

 

* 행동 기반 코호트 (Behavior Cohort)

사용자의 특정 행동이나 이벤트(예: 앱 내 구매, 특정 기능 사용 등)를 기준으로 그룹화

ex) 특정 캠페인을 본 후 구매한 고객들의 그룹을 분석하여 캠페인의 효과를 평가

 

* 크기 기반 코호트 (Size Cohort)

그룹의 상대적 크기를 기준으로 분류

ex) 특정 기간 동안 가입한 사용자 수를 기준으로 그룹을 나누고, 그룹별 행동을 비교

 

 

 

 

예시

예를 들어 아래와 같이 사업 시작 후 4개월 매출 현황이 있다고 가정한다.

  1 2 3 4
전체 고객 () 1,000 2,000 3,000 4,000
고객 당 평균 매출 50,000 45,000 43,300 45,000

 

고객 당 평균 매출이 소폭 감소한 후 상승하는데, 위 표를 통해서는 상황이 좋아지는지 나빠지는지 정의하기 어렵다.

 

아래 표는 같은 데이터를 고객의 가입 시기에 따라 나누어 표를 다시 그린 것이다.

코호트 볼륨 1개월 2개월 3개월 4개월
1월 가입자 1,000 50,000 30,000 20,000 10,000
2월 가입자 1,000 60,000 40,000 20,000  
3월 가입자 1,000 70,000 60,000    
4월 가입자 1,000 80,000      
평균 1,000 70,000      

 

  위 표를 통해서는 다양한 분석을 할 수 있다. 매월 신규 가입자의 수, 매월 신규로 가입한 고객의 첫 달 평균 구매액의 차이, 월별 가입자들의 시간에 따른 평균 구매액 변화 등 시간의 흐름에 따라 파악할 수 있는 것들이 보인다.

  전체 고객 당 평균 매출 표에서는 매출액 변화가 정적인 것처럼 보이지만, 시기에 따라 표를 나누면 고객들의 첫 달 구매액이 증가하고 있으며 월별 구매액의 감소폭이 개선되고 있다는 것을 알 수 있다.

  이와 같이 코호트 분석을 이용하면 매출, 유지율, 바이럴 효과, 이탈율 등을 분석할 수 있게 된다.

 

 

 

 

 

 

 

 

 

 

+) 참고 링크 : https://datarian.io/blog/cohort-analysis