Introducción al modelado predictivo del valor de la vida útil del cliente
¿Cómo puede predecir el valor de un cliente en el transcurso de sus interacciones con su empresa? Esa es una pregunta que muchas empresas están tratando de responder, y es el tema de en el que nos centramos.
El valor de por vida del cliente ( CLV) es el » valor descontado de las ganancias futuras generadas por un cliente «. La palabra «ganancias» aquí incluye estimaciones de costos e ingresos, ya que ambas métricas son muy importantes para estimar el CLV verdadero; sin embargo, el enfoque de muchos CLV Los modelos están en el lado de los ingresos. La razón de esto es que los ingresos son más difíciles de pronosticar que el costo, por lo que es más necesario un modelo para predecirlos (y conocer los ingresos que generará un cliente puede informar su gasto en ese cliente). Los tipos de modelos a menudo se denominan » modelos de equidad del cliente».
Los clientes pueden generar ingresos para una empresa de muchas formas diferentes. Obviamente, un cliente que realiza compras directas ciertamente aumenta su valor de por vida. Además, las referencias de ese cliente, el marketing indirecto y los efectos del boca a boca contribuyen en última instancia al valor de un cliente. Las referencias son muy importantes y no hay nada que le guste más a una empresa que un » Me gusta» en Facebook o un recurso compartido en LinkedIn, por ejemplo.
Tener en cuenta estos efectos de red puede ser un desafío al principio, por lo que, en aras de la simplicidad, me centraré en las compras directas solo en esta publicación.
Valor histórico de la vida útil del cliente
Hay muchas metodologías que se ocupan de la parte del CLV asociada con las compras directas, pero las dos clases más amplias se definen generalmente como CLV histórico y predictivo. Los métodos históricos miran datos pasados y emiten un juicio sobre el valor de los clientes basándose únicamente en transacciones pasadas, sin ningún intento de predecir qué harán esos clientes a continuación.
En principio, este es un enfoque válido si los clientes se comportan de manera similar y han estado interactuando con la empresa durante aproximadamente la misma cantidad de tiempo. Sin embargo, en general, existe una buena cantidad de heterogeneidad entre los clientes. El siguiente cuadro muestra algunas trayectorias de compra para ilustrar mi punto. El tiempo va de izquierda a derecha. La línea punteada vertical representa el tiempo presente, y cada línea vertical pequeña representa un pedido / compra realizada por un cliente:
Los enfoques históricos típicos aplicarán un criterio de antigüedad de la última compra para distinguir entre usuarios activos e inactivos. El comportamiento promedio de compras pasadas se emplea para medir el valor relativo ( o en algunos casos, absoluto) de los clientes.
Sin embargo, existen varios problemas con tales metodologías. Por ejemplo, el primer cliente del gráfico anterior ha realizado más compras que el segundo cliente, pero, de hecho, es más probable que el primer cliente esté inactivo que el segundo. El valor basado en promedios pasados indicaría que el primer cliente es más valioso ; sin embargo, el segundo cliente todavía está activo y podría realizar muchas más compras en el futuro. Los métodos que tienen en cuenta la variación en el comportamiento de los clientes nos permitirán llegar a conclusiones más precisas sobre la vida útil del cliente y el comportamiento de compra.
Valor predictivo de la vida útil del cliente
El objetivo del CLV predictivo es modelar el comportamiento de compra de los clientes para inferir cuáles serán sus acciones futuras. Si un modelo y una metodología CLV predictivos tienen sentido para su caso de uso, dependerá en gran medida del contexto empresarial. Para el propósito de esta publicación, el contexto comercial se define en dos dimensiones: entornos comerciales no contractuales versus contractuales, y oportunidades de compra continuas versus discretas. Esta definición de contexto debería cubrir la gran mayoría de casos comerciales. A continuación, he incluido una tabla que destaca las diferencias entre estos contextos:
A continuación se muestran algunos ejemplos de casos de negocio pertenecientes a cada uno de los cuatro cuadrantes. Los modelos CLV para gimnasios o pólizas de seguro serán diferentes de los que se dirigen a las compras de comestibles, por ejemplo:
Modelos probabilísticos para el entorno de compra continua y no contractual
Quizás el contexto empresarial más común es el no contractual, en el que la oportunidad de compra es continua. Se ha creado una gran cantidad de modelos probabilísticos para abordar los desafíos de modelar el valor de la vida útil en ese contexto. Este tipo de modelos se utilizan desde hace varias décadas. Son aplicables a una amplia variedad de situaciones de negocios y, en muchos casos, son su “ go-to” modelos. Los modelos probabilísticos son definitivamente un buen primer paso (¡ y a veces el único!) Hacia el modelado CLV.
El aprendizaje automático y los modelos de Markov también son enfoques valiosos para el modelado CLV, pero deben ajustarse y, a veces, personalizarse para adaptarse a los detalles de una situación empresarial. En los pocos estudios de caso que comparan el resultado de estos diferentes modelos, los enfoques probabilísticos y los modelos de aprendizaje automático tienden a producir resultados de calidad similar.
Diferentes modelos probabilísticos, pero marcos de modelado similares
Echemos un vistazo más de cerca a los modelos probabilísticos. Existen varios tipos diferentes de modelos probabilísticos; sin embargo, todos tienden a compartir un marco de modelado similar. En este marco, los modelos CLV a menudo restringen los mismos tres parámetros latentes ( no observados) que caracterizan el comportamiento de los clientes:
- Vida útil : el período durante el cual un cliente mantiene su relación con la empresa.
- Tasa de compra : este parámetro corresponde al número de compras que realizará un cliente durante un período de tiempo determinado.
- Valor monetario : esta parte del modelo se ocupa de asignar un monto en dólares a cada transacción futura
En el entorno no contractual, estos parámetros no se observan. Los modelos probabilísticos nos ayudarán a restringir estos parámetros a nivel del cliente y a hacer inferencias sobre las compras y el valor futuros.
El modelo de Pareto / NBD: un buen primer paso hacia el modelado CLV
El modelo Pareto / NBD es quizás el modelo probabilístico más conocido y aplicado con mayor frecuencia en el contexto no contractual . Creé el cuadro a continuación para ilustrar cómo funciona el modelo:
La porción de Pareto / NBD está en el lado izquierdo del gráfico en el rectángulo punteado. Pareto / NBD solo se centra en el recuento de compras y la vida útil. No aborda el componente de valor monetario. Existen algunos modelos que abordan el valor monetario; Elegí la extensión Gamma Gamma para el modelo Pareto / NBD (como se ve en el gráfico anterior).
El modelo Pareto / NBD hace las siguientes suposiciones con respecto a la población de clientes:
- El recuento de compras sigue una distribución de Poisson con tasa λ. En otras palabras, el momento de estas compras es algo aleatorio, pero la tasa ( en conteos / unidad de tiempo) es constante. A su vez, esto implica que el tiempo entre compras a nivel de cliente debe seguir una distribución exponencial.
- La distribución de por vida sigue una distribución exponencial con pendiente μ. El valor esperado de dicha distribución es 1 / μ y corresponde a la vida útil del usuario.
- Los parámetros latentes λ y μ están restringidos por dos distribuciones gamma previas que representan nuestra creencia de cómo estos parámetros latentes se distribuyen entre la población de clientes. Estas dos distribuciones gamma tienen parámetros ( r, α) para el recuento de compras y ( s, β) para la vida útil. El objetivo es encontrar estos cuatro parámetros. A partir de estos, se pueden derivar todas las métricas procesables.
En la práctica, así es como entrenamos un modelo Pareto / NBD para encontrar estos cuatro parámetros. A continuación se muestra un cuadro simple que demuestra el proceso:
Primero, debe entrenar el modelo durante un período de entrenamiento con una duración mínima que corresponda a tres veces el tiempo típico entre compras de sus clientes. Con los datos y las simulaciones de los clientes, descubrimos que tres veces es un mínimo. De cinco a diez es definitivamente mejor.
El período de entrenamiento le dará una estimación de los parámetros del modelo. A continuación, debería poder comparar lo que predice el modelo con lo que observó en el período de formación a nivel de cliente. Si el recuento de compras coincide, el siguiente paso es comparar las predicciones con las observaciones realizadas en un período de validación / reserva. Este período no ha sido observado por el modelo. Si el modelo tiene un buen rendimiento en el período de validación / reserva, entonces puede pronosticar por un período de tiempo de varios meses a varios años, según sus necesidades comerciales.
La extensión Gamma-Gamma al modelo Pareto / NBD
Como se mencionó anteriormente, el modelo Pareto / NBD se enfoca en modelar la vida útil y el recuento de compras. La extensión del valor monetario al modelo Pareto / NBD que se indica en el lado derecho del gráfico, Gamma-Gamma, hace algunas suposiciones:
- A nivel de cliente, el valor de la transacción / pedido varía aleatoriamente alrededor del valor de transacción promedio de cada cliente. (Eso, en sí mismo, no es demasiado controvertido).
- El valor medio observado es una métrica imperfecta del valor de transacción medio latente E (M), donde M representa el valor monetario.
- El valor de transacción promedio varía entre los clientes, aunque estos valores son estacionarios. (Esta es una gran suposición).
- La distribución de los valores medios entre los clientes es independiente del proceso de transacción. En otras palabras, el valor monetario se puede modelar por separado del recuento de compras y los componentes de la vida útil del modelo. Esto puede o no ser válido en situaciones comerciales típicas.
Uniendo estos dos modelos: estimaciones de CLV a nivel de cliente
El modelo Pareto / NBD le permite calcular el número esperado de compras en un período de pronóstico a nivel de cliente. Además, el modelo Gamma-Gamma permite asignar un valor a cada una de esas compras futuras. Se convierte en un ejercicio trivial pronosticar el CLV para cada cliente; simplemente tiene que multiplicar los valores esperados de cada modelo. Eso debería permitir que cualquiera pueda hacer comparaciones CLV durante el período de espera antes de hacer cualquier pronóstico.
Información Adicional
Para ayudar a que estos conceptos sean muy concretos, he creado un repositorio público de github que contiene un cuaderno y un conjunto de datos de prueba de un minorista en línea para complementar mi webcast de O’Reilly. En el cuaderno, encontrará los pasos para entrenar los modelos Pareto / NBD y Gamma-Gamma y calcular CLV a nivel de cliente.