La métrica que más defendí y que hoy creo que estaba midiendo lo equivocado
Durante años, en distintos roles como Líder de Loyalty en grandes operadores latinoamericanos, presenté el Net Promoter Score como métrica principal para reportar la salud de los programas que lideraba. Aparecía en cada presentación al comité directivo, en cada revisión con marketing, en cada conversación de planeación estratégica.
El score se subía a la diapositiva con cierto orgullo cuando crecía, y se explicaba con cuidado cuando bajaba. Era la métrica. Hoy creo que estaba equivocado en hacerlo así. No porque NPS sea una métrica inútil, en su uso original es útil para lo que fue diseñada, sino porque la estaba usando para responder una pregunta que no responde.
Estaba midiendo advocacy declarada cuando lo que necesitaba medir era loyalty observada. Y esa confusión, que comparto con buena parte de la industria latinoamericana, sostiene una conversación que el comité directivo no respeta.
Por qué NPS no mide loyalty
Hay que empezar reconociendo lo que NPS sí mide. Fue diseñado por Frederick Reichheld en 2003 para capturar la probabilidad declarada de que un cliente recomiende una marca a un amigo o colega. Eso es advocacy, no loyalty. Son cosas distintas, aunque la industria las trate como equivalentes.
Un cliente puede ser fiel a una marca sin recomendarla nunca y puede recomendarla sin ser realmente fiel, por razones que van desde un regalo social hasta una respuesta cordial en un cuestionario.
Hay un segundo problema más serio. NPS es declaración de intención, no comportamiento observado. La literatura econométrica documenta consistentemente que la correlación entre intención declarada en encuestas y comportamiento posterior real es modesta, típicamente entre 0.2 y 0.4 en contextos de consumo masivo.
Eso significa que menos del 16% de la varianza del comportamiento real de los clientes se explica por sus respuestas al NPS. Para una métrica que pretende ser indicador principal de salud de la relación, esa capacidad predictiva es notablemente insuficiente.
Un tercer problema es de timing. NPS es métrica de momento. Captura una opinión en una fecha. Loyalty, en cambio, es fenómeno longitudinal, se construye o se erosiona a lo largo del tiempo.
Un score de 8 sobre 10 en marzo no garantiza nada sobre el comportamiento del cliente en julio. Y la mayoría de los programas mide NPS con periodicidad insuficiente para detectar esos cambios cuando ya están sucediendo.
Por qué la industria sigue usándola, incluyéndome
Antes de proponer alternativas, conviene examinar honestamente por qué NPS sigue siendo ortodoxia a pesar de sus limitaciones técnicas. No es por ignorancia colectiva. Es por tres factores operativos que cualquier practitioner de la industria reconoce de inmediato.
Primero, es simple de medir. Una sola pregunta, una escala de 0 a 10, un cálculo aritmético elemental. Cualquier equipo puede levantar la encuesta y presentar el resultado en cuestión de días.
Segundo, es fácil de presentar. Un número entre menos cien y cien que se entiende sin diccionario, que se compara entre industrias publicadas en reportes, que cabe en una diapositiva sin requerir contexto adicional. Es métrica diseñada para reuniones ejecutivas cortas, no para análisis técnico profundo.
Tercero, es comparable. Existen benchmarks publicados por industria, por geografía, por tipo de programa. La capacidad de decir “nuestro NPS está por encima del promedio del sector” en una junta tiene un efecto retórico que ninguna métrica de comportamiento observado replica fácilmente.
Lo que el cliente realmente le dice al programa cuando lo dejas hablar con su comportamiento
Si NPS pregunta lo equivocado, la alternativa no es preguntar mejor. Es dejar de preguntar y empezar a observar. El comportamiento del cliente vis-à-vis el programa contiene toda la información que el NPS pretende capturar, y la contiene sin el ruido de las intenciones declaradas. Propongo un sistema de cinco ratios que, combinados, dan una vista sustancialmente más útil que cualquier indicador aislado.
El primer ratio: Puntos redimidos en un periodo divididos entre puntos acumulados en el mismo periodo. Mide la tasa de redención real, que es la métrica directa de si el programa está convirtiendo intención en acción. Si el ratio es alto, los miembros encuentran valor utilizable en el catálogo y la fricción para redimir es baja. Si es bajo, los puntos se están acumulando como pasivo creciente sin convertirse en experiencia de valor para el cliente, señal directa de que el programa está fallando en cerrar el ciclo.
El segundo ratio: Redentores rápidos del cohorte divididos entre el total de usuarios inscritos en ese mismo cohorte, expresado como porcentaje. Mide la velocidad de activación del programa. Un nuevo miembro que redime dentro de los primeros 90 días tiene retención significativamente mayor que uno que tarda más. Si el porcentaje de activación temprana se deteriora cohorte tras cohorte, el programa está perdiendo capacidad de enganche en el momento de mayor entusiasmo del miembro, indicador adelantado de churn futuro.
El tercer ratio: Uplift en acumulación de un miembro después de su primera redención, comparado contra sus propias tasas de acumulación en periodos previos equivalentes. La comparación debe ser intra-individual, el mismo miembro en los seis meses post-redención versus el mismo miembro en los seis meses anteriores no contra el promedio del programa. Esa comparación intra-individual es lo que captura el efecto psicológico real. Si después de redimir el miembro acumula más, el programa está generando un círculo virtuoso.
El cuarto ratio: Tasa de cancelación o abandono de usuarios que han redimido al menos una vez, comparada contra la tasa de los que nunca han redimido. Muestra la asociación entre redención y permanencia. Si los redentores cancelan significativamente menos que los no redentores, hay evidencia de que la redención está actuando como mecanismo de retención. Conviene aclarar la limitación: para aislar la causalidad pura, es decir, para probar que es la redención la que genera la permanencia, y no que los miembros más comprometidos previamente son los que terminan redimiendo, se requiere control por engagement previo a la primera redención.
El quinto ratio: Margen incremental neto generado por los redentores, comparado contra el de no-redentores equivalentes en el mismo segmento, misma frecuencia previa y mismo cluster de comportamiento. Cierra el círculo conectando los cuatro ratios anteriores con la pregunta financiera que el comité directivo realmente está haciendo. Los primeros cuatro miden salud de la relación cliente-programa. El quinto traduce esa salud a contribución al P&L.
Por qué los ratios funcionan donde los indicadores aislados fallan
Hay una razón estructural por la que combinar métricas en ratios produce información más útil que reportar indicadores individuales. Cualquier indicador aislado puede manipularse o malinterpretarse. Engagement rate sube o baja según cómo definamos miembro activo. NPS varía según en qué momento se levante la encuesta. Número total de redenciones puede crecer simplemente porque crece la base de miembros sin que mejore la propuesta de valor.
Los ratios son más difíciles de manipular porque relacionan dos variables que normalmente se mueven juntas. Si quieres inflar el numerador, el denominador tiende a moverse en la misma dirección, y la relación se mantiene relativamente estable.
Eso convierte al ratio en mejor reflejo de la dinámica subyacente que cualquiera de las dos variables por separado. Y un sistema de cinco ratios, observado a lo largo del tiempo, ofrece algo que ningún indicador aislado puede ofrecer: una imagen completa del estado de relación entre el cliente y el programa, sostenida en comportamiento observado, no en opiniones declaradas.
Hay un beneficio adicional que la conversación operativa rara vez nombra. Los ratios son defendibles ante un comité de auditoría de una forma que NPS no lo es.
Volver a mirar las prácticas que uno mismo defendió durante años es ejercicio incómodo pero útil. NPS no es un fraude ni una métrica diseñada con mala fe. Es una herramienta válida para responder una pregunta específica sobre advocacy declarada.
El problema es que la industria de customer loyalty, incluyéndome a mí durante años, la ha usado para responder otra pregunta distinta, la pregunta sobre la salud real de la relación cliente-programa que la herramienta no fue diseñada para responder. El día que sustituí NPS por un sistema de ratios de comportamiento observado en las presentaciones que llevaba al comité directivo, dos cosas cambiaron.
La primera, las conversaciones con finanzas dejaron de ser defensivas y empezaron a ser sustantivas. La segunda, los problemas reales del programa se volvieron visibles antes de que se materializaran en el P&L. Las dos cosas suceden por la misma razón: el comportamiento observado anticipa el resultado financiero de forma que las intenciones declaradas nunca lo hacen.
La pregunta para quien dirige hoy un programa de lealtad en América Latina no es si NPS está bien o mal. Es si la métrica que está presentando al comité responde la pregunta que el comité realmente está haciendo, o si responde una pregunta más cómoda.
