O exemplo de construção e análise de Cohort apresentado no artigo faz parte do portfólio de trabalhos que fiz durante a formação em Análise de Dados da Comunidade DS.

 

O que é a Análise Cohort

A Análise de Cohort é uma técnica de analítica cujo objetivo é caracterizar pessoas ou eventos que tenham em comum uma determinada característica durante um determinado período de tempo, e com isso observar o seu comportamento ao longo desse período temporal.

Dando um exemplo simples do nosso quotidiano e depois passando para o ambiente online de desenvolvimento de produtos digitais.

Exemplo offline:  Imaginando que vais almoçar fora com os teus pais, mais com os teus 2 irmãos e com os teus avós ao restaurante “Almoça Aqui”. E imagina que esse almoço foi o almoço do primeiro dia do ano – 1 Janeiro de 2025.

Ou seja, e considerando apenas a tua família, o restaurante “Almoça Aqui” recebeu no dia 1 Janeiro de 2025, 7 pessoas, nesse dia, mês e ano. E tu e a tua família, partilham uma característica em comum: foram almoçar a esse restaurante simultaneamente nesse dia.

Soubeste que os teus pais foram jantar ao restaurante no dia seguinte com mais um casal de amigos e o seu filho de 7 anos (considera novamente apenas os teus pais e o casal de amigos como únicos clientes nesse restaurante ao jantar).

E tu foste no dia 3 de janeiro, com a tua namorada e fechaste o restaurante só para vocês e fizeste-lhe uma surpresa :).
Soubeste mais tarde pelos teus pais que o casal de amigos dos teus pais foi ao restaurante no mesmo dia que foste com a tua namorada, mas almoçar.

Ou seja e em termos de Análise de Cohort, teríamos que se representa na tabela abaixo:

Primeira visita / Atividade

Dia 1.1.25

Dia 2.1.25

Dia 3.1.25

Dia 1.1.25

7

2

1

Dia 2.1.25

3

2

Dia 3.1.25

1

 

Exemplo de E-commerce: O exemplo de e-commerce segue exatamente, mesma lógica, sendo que desta vez estamos a analisar meses.

First-purchase / Atividade

Jan 25

Fev 25

Mar 25

Jan 2025

1000

700

300

Fev 2025

600

400

Mar 2025

500

Notas Importantes

  1. A característica comum às pessoas, não precisa de ser obrigatoriamente a primeira visita, ou a primeira compra. Pode ser, por exemplo e para o caso do restaurante o “prato” escolhido. E para o caso de e-commerce a categoria de produto comprado “sapatos”. A característica escolhida para a análise depende da própria análise que se pretende fazer.
  2. Mais à frente veremos melhor a interpretação dos dados da tabela de Análise de Cohort. Aqui quero apenas deixar a nota que, por exemplo para o dia 2 de Janeiro de 2025 (que será a data de cohort) a célula 1 de Janeiro de 2025, porque esse cohort/safra não existia (logicamente) nesse dia. O mesmo raciocínio aplica-se para os meses na loja online

 

Para que serve a Análise Cohort

O objetivo principal de uma Análise Cohort é para medir o comportamento das pessoas na utilização de um determinado produto ou serviço. Agora esse comportamento traduz-se nalguma métrica que pode variar, consoante as características dos grupo que foi selecionada:

  • Retenção
  • Life-Time Value
  • Melhores Produtos

 

Que Dimensões e Métricas Precisamos para fazer uma Análise Cohort

As dimensões estarão relacionadas com o tempo ou inteligência de tempo. No exemplo do Restaurante estaríamos a falar da dimensão de tempo em dias. Já no caso do E-commerce a dimensão de inteligência de tempo seria o mês.

Outra dimensão que vamos precisar e que, de certa forma está relacionada com o tempo é, no exemplo do restaurante da data da “primeira visita”. E no caso do E-commerca da data da “primeira compra”.

As métricas que vamos precisar seria o Nº de primeiras visita ao restaurante e para o E-commerce, o Nº primeiras Compras.

No exemplo prático, temos de pensar no binómio “Facto-Dimensão”.

 

Exemplo de uma Análise Cohort feita em Excel

Enquadramento rápido:

Um Grupo de Beleza com várias lojas físicas espalhadas por Portugal, com o objetivo fazer acreditar no poder transformador da beleza e comercializar diferentes categorias de produtos de beleza.

Recentemente, foi identificado um desafio crescente: a retenção de clientes. A empresa percebeu que, embora as vendas continuem ocorrendo, a frequência de compras de clientes recorrentes tem diminuído.

O objetivo é criar indicadores que mostrem como os clientes interagem com o Grupo de Beleza ao longo de um determinado período de tempo.

 

Procedimento

Para não tornar o artigo longo e exaustivo, admite que todos os dados que seriam precisos estão na base de dados em Excel denominada de Customers. E nela temos as seguintes dimensões: Customer_Id, Order_Id, Order_Date.

1 – Que dimensões, métricas e factos vamos precisar

Facto:

    • Customer_ID

Dimensões:

    • Order_Date (Recorrência de compras) e precisamos de fazer a análise mensal

Dimensões de tempo derivadas da Order_Date:

    • Order_Date (da primeira compra) e precisamos de fazer a análise mensal

Customer_ID

Order_Date (first-purchase)

Order_date (Recorrência)

AA123

1.1.23

1.1.23

BB321

1.2.23

1.2.23

AA123

1.1.23

2.3.23

BB321

1.2.23

1.2.24

AC123

2.2.23

2.2.23

AC123

2.2.23

5.5.23

CA321

4.8.23

4.4.24

CD123

4.6.24

4.6.24

CD123

4.6.24

1.3.25

EF123

8.7.24

8.8.24

 

2 – Como vamos construir a Análise Cohort em Excel

2.1 Criar uma tabela com 3 colunas:

Coluna 1 – Customer_ID

    • Não precisamos de fazer nenhum cálculo

Coluna 2 – Order_Date (data da primeira compra, em mês)

    • Utilizando duas fórmulas:
      • Formatar os valores de “Date” da coluna Order_Date (first_purchase) em formato custom do tipo “MM-YYYY”
      • Utilizar a fórmula: =MINIFS[min_range;criteria_range1;criteria]

Coluna 3 – Order_Date (recorrência de compras)

    • Utilizando três fórmulas:
      • Formatar os valores de “Date” da coluna Order_Date (Recorrência) em formato custom do tipo “MM-YYYY”
      • Utilizar, por exemplo a fórmula =DATEDIF[initial_date;final_date;format], neste caso meses

 

Ou seja, vamos ter uma tabela similar a esta:

Customer_ID

Order_Date (first-purchase)

Order_date (Recorrência)

Recorrência calculada (meses)

AA123

1.23

1.23

0

BB321

2.23

2.23

0

AA123

1.23

3.23

2

BB321

2.23

2.24

12

AC123

2.23

2.23

0

AC123

2.23

5.23

3

CA321

8.23

4.24

8

CD123

6.24

6.24

0

CD123

6.24

3.25

9

EF123

7.24

8.24

1

 

4 – A Tabela de Cohort no Excel – Exemplificativa

A tabela de cohort resulta de uma pivot table em que utilizamos os facto-dimensões trabalhadas anteriormente. Ou seja, o facto será o “customer_Id” colocado em valores. E as dimensões serão em colunas e linhas respetivamente,“order_date” e “first_purchase”. Para termos os valores em %, temos de dividir o número de clientes em cada um dos meses pelo total de clientes no mês em que aconteceu a Order_Date – first_purchase.

cohort-exemplo-pratico

 

5 – Interpretação dos Resultados

Em linha:

Conseguimos analisar a retenção dos clientes ao longo dos meses que estamos a analisar. Por exemplo, analisando a primeira linha, percebemos que dos clientes que fizeram a primeira compra no mês 0, só cerca de 10% voltaram a comprar no mês seguinte e nenhum comprou no 3º mês.

Podes analisar a média de cohorts, tendo em atenção o período de maturação do cohort. Por exemplo, considerando um mês

Em coluna:

Conseguimos analisar a retenção de novos clientes, e em relação aos níveis de retenção do mesmo mês. Considerando o exemplo de cima, verificamos que na 2ª linha e no mês 1, ao invés dos 9,9% de retenção, foi conseguida uma retenção de cerca de 17% e no mês seguinte de 8%.

O melhor cohort foi o mês de Novembro, analisando a retenção para um mês, e teve cerca de 24% de retenção de clientes.

Este tipo de análise, certamente que poderá ser feito recorrendo a outras ferramentas, como SQL, Python ou até mesmo em ferramentas já “prontas” como o GA4 que nos proporciona uma análise de cohort para o número de visitas. Tudo depende do conhecimento do problema e do conhecimento e da disponibilidade das ferramentas disponíveis.