caso de estudio: powerade

19
1 Caso de Estudio: Powerade Coca Cola FEMSA es la embotelladora más grande de la marca Coca-Cola a nivel mundial, al atender 2.9 millones de puntos de venta y comercializar 3.2 billones de cajas por año 1 Ingresa al mercado colombiano en el 2003, año en el que adquiere el 100% del sistema Coca-Cola de América Latina. La compañía maneja bebidas carbonatadas como no carbonatadas bajo varias marcas, tales como. Coca-Cola, Fanta, Sprite, Fresca, Ciel, Café Black, Fuze Tea y Powerade. Con la marca Powerade se embotellan exclusivamente bebidas isotónicas que buscan rehidratar y reponer minerales perdidos en la actividad física. Según consultas a representantes de la empresa, las principales bebidas que le compiten en el país se encuentran Gatorade (84,7% del mercado), Squash (0,1%) y Sporade (3,3%); En este mercado Powerade ocupa el segundo lugar con (12%). FEMSA Colombia ha concluido que el mercado de bebidas isotónicas no está completamente atendido y considera que existe la oportunidad de aumentar su pool de consumidores del 12% al 21% 2 . Con el objetivo de alcanzar la meta del 21%, el presente estudio se orienta a identificar a los clientes a los que Coca-Cola FEMSA debe ofrecer sus bebidas isotónicas para así capturar el mercado desatendido de Bogotá, que representa el 16% de ventas de bebidas isotónicas del país. En el marco del objetivo mencionado este estudio busca encontrar los factores que explican el éxito de un cliente de bebidas isotónicas a fin de identificar otros clientes que teniendo características similares, no alcanzan el mismo nivel de ventas. Es importante señalar que no se busca identificar dónde abrir nuevos puntos de venta exitosos. Los clientes de FEMSA Colombia para bebidas isotónicas cubren un gran número de canales, cerca de 27, que involucran desde grandes superficies como súper-mercados hasta pequeños comercializadores como porterías. Sin embargo, a partir del análisis histórico de ventas y de la opinión experta de los representantes de la compañía, se acordó que el estudio se debería centrar en cuatro canales: i) Licorerías/Cigarrerías, ii) Mini-mercados, iii) Tiendas de Barrio y iv) Panaderías. Con base en los datos suministrados por Coca-Cola FEMSA se puede afirmar que la distribución de las transacciones por canal no es uniforme. Es así que en 2014 los tres (3) mejores canales participan con más del 50% donde los supermercados presentan la mayor participación, seguidos de las Tiendas de Barrio y los Mini-mercados. Es de tener en cuenta que en este caso de estudio no se incluyeron los supermercados por solicitud de FEMSA Colombia 2 (Ver Figura 1). 1 Según la Página oficial de FEMSA: http://www.femsa.com/es 2 Según reunión realizada con representantes de la empresa el 19 de agosto de 2015

Upload: others

Post on 31-Jul-2022

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Caso de Estudio: Powerade

1

Caso de Estudio: Powerade

Coca Cola FEMSA es la embotelladora más grande de la marca Coca-Cola a nivel mundial, al atender

2.9 millones de puntos de venta y comercializar 3.2 billones de cajas por año1Ingresa al mercado

colombiano en el 2003, año en el que adquiere el 100% del sistema Coca-Cola de América Latina. La

compañía maneja bebidas carbonatadas como no carbonatadas bajo varias marcas, tales como.

Coca-Cola, Fanta, Sprite, Fresca, Ciel, Café Black, Fuze Tea y Powerade. Con la marca Powerade se

embotellan exclusivamente bebidas isotónicas que buscan rehidratar y reponer minerales perdidos

en la actividad física. Según consultas a representantes de la empresa, las principales bebidas que le

compiten en el país se encuentran Gatorade (84,7% del mercado), Squash (0,1%) y Sporade (3,3%);

En este mercado Powerade ocupa el segundo lugar con (12%).

FEMSA Colombia ha concluido que el mercado de bebidas isotónicas no está completamente

atendido y considera que existe la oportunidad de aumentar su pool de consumidores del 12% al

21%2. Con el objetivo de alcanzar la meta del 21%, el presente estudio se orienta a identificar a los

clientes a los que Coca-Cola FEMSA debe ofrecer sus bebidas isotónicas para así capturar el mercado

desatendido de Bogotá, que representa el 16% de ventas de bebidas isotónicas del país.

En el marco del objetivo mencionado este estudio busca encontrar los factores que explican el

éxito de un cliente de bebidas isotónicas a fin de identificar otros clientes que teniendo

características similares, no alcanzan el mismo nivel de ventas. Es importante señalar que no se

busca identificar dónde abrir nuevos puntos de venta exitosos.

Los clientes de FEMSA Colombia para bebidas isotónicas cubren un gran número de canales, cerca

de 27, que involucran desde grandes superficies como súper-mercados hasta pequeños

comercializadores como porterías. Sin embargo, a partir del análisis histórico de ventas y de la

opinión experta de los representantes de la compañía, se acordó que el estudio se debería centrar

en cuatro canales: i) Licorerías/Cigarrerías, ii) Mini-mercados, iii) Tiendas de Barrio y iv) Panaderías.

Con base en los datos suministrados por Coca-Cola FEMSA se puede afirmar que la distribución de

las transacciones por canal no es uniforme. Es así que en 2014 los tres (3) mejores canales

participan con más del 50% donde los supermercados presentan la mayor participación, seguidos de

las Tiendas de Barrio y los Mini-mercados. Es de tener en cuenta que en este caso de estudio no se

incluyeron los supermercados por solicitud de FEMSA Colombia 2 (Ver Figura 1).

1 Según la Página oficial de FEMSA: http://www.femsa.com/es

2 Según reunión realizada con representantes de la empresa el 19 de agosto de 2015

Page 2: Caso de Estudio: Powerade

2

Figura 1. Distribución de Transacciones por Canal (2014)

De otra parte, Coca-Cola FEMSA no puede determinar si el nivel de transacciones de un

determinado cliente se explica en características tales como cercanía a sitios de interés o si estas no

se están aprovechando para lograr mayores transacciones de Powerade. Igualmente la Firma no

cuenta con herramientas para determinar el éxito de un cliente para bebidas isotónicas pues no ha

realizado los análisis correspondientes. Esto significa que una de las dificultades a atender se

presenta como problema “no supervisado”.

Otro de las complicaciones que enfrenta el análisis se relaciona con el número de clientes de FEMSA

Coca-Cola en Bogotá, que son alrededor de 165’000, cada uno de los cuales cuenta con más de 12

características intrínsecas.

Finalmente también se presenta el problema de la distribución no uniforme en la ciudad de los

19’338 clientes, pertenecientes a los cuatro (4) canales estudiados durante el año 2015. (Ver Figura

2).

Page 3: Caso de Estudio: Powerade

3

Figura 2. Clientes del 2015 de los canales: Mini-mercados, Panaderías, Tiendas de Barrio y

Licorerías/ Cigarrerías

Ante la situación anteriormente descrita y teniendo en cuenta que el objetivo de Coca-Cola FEMSA

es aumentar el porcentaje de participación en el mercado de bebidas isotónicas a través de la

captura del mercado desatendido, la pregunta que se debe resolver es: ¿A cuáles clientes de la

ciudad de Bogotá, pertenecientes a los cuatro (4) canales escogidos, se le debe ofrecer Powerade?

Análisis Exploratorios

Para resolver la pregunta de Coca-Cola FMSA se ha realizado el siguiente análisis respecto al

comportamiento de las transacciones de Powerade y las características de los clientes:

Con base en el registro de ventas realizado entre el primer trimestre de 2012 y el segundo trimestre

de 2015 se observa una tendencia creciente en las ventas de bebidas isotónicas siendo el

más importante el verificado en el segundo trimestre del 2015. Además de la clara

tendencia creciente, se verifica que actos como la promoción de Powerade durante la Copa

América de futbol3 mejoran el nivel de ventas de manera significativa. (Ver Figura 3)

3 Según datos suministrados por la firma

Page 4: Caso de Estudio: Powerade

4

Figura 3. Registro de Ventas. Desempeño Trimestral (2012-2015)

Un análisis sobre la estratificación del mercado realizado para el 2014 muestra que si bien la mayoría

de ventas se realizan a clientes de estrato III, con una diferencia de más de mil unidades transadas

con respecto a los otros estratos, en promedio, el estrato V tiene el mejor comportamiento al

superar en 3 transacciones al segundo mejor estrato que es el IV. (Ver Figura 4)

Figura 4. Promedio de Transacciones por Estrato (2014)

Según la clasificación de la firma en clientes oro, plata y bronce establecida según la demanda de

productos Coca-Cola, de los datos obtenidos resulta que en promedio el mayor número de

transacciones corresponde a los clientes plata (Ver Figura 5). Esto quiere decir que los clientes que

más piden productos Coca-Cola, en promedio, no son los que más bebidas isotónicas solicitan.

Page 5: Caso de Estudio: Powerade

5

Figura 5. Promedio de Transacciones por Calificación (2014)

En cuanto a la distribución de ventas según la localización, la información muestra que el mayor

número de transacciones se realiza en Bogotá Norte donde es 4 veces superior a la cantidad

transada en Bogotá Sur. Esta información no significa que el 100% de esta cantidad se distribuya en

Bogotá Norte pues según información obtenida en reunión con representantes de FEMSA, ciertos

clientes que reciben los productos en centros de distribución ubicados en Bogotá Norte los trasladan

a zonas en el Sur por sus propios medios. (Ver Figura 6).

Figura 6. Distribución de Ventas por Localización

Page 6: Caso de Estudio: Powerade

6

Descripción de los Datos

Para lograr identificar a cuáles clientes se les debe ofrecer bebidas Powerade, se cuenta con la

información asociada a las características de los clientes durante el período comprendido entre

enero del 2012 y junio del 2015.

La información se organiza en las siguientes variables:

CEDIS: Variable binaria que divide a los clientes según su localización: al sur de la calle 13 o al

norte de esta.

OUTNUM: Número de identificación del cliente

GEC: Puntaje interno asignado a los clientes de FEMSA Colombia según la cantidad de

bebidas de marca Coca-Cola que estos compran, siendo oro (O) la más alta categoría, plata

(P) la segunda y bronce (B) la más baja.

NSE: Estrato dominante en el entorno del establecimiento del cliente, lo cual se desprende

de la estratificación incluida en las facturas de servicios públicos.

CREDAT: Fecha en la cual el establecimiento se ha formalizado como cliente.

SELMOD: Modo de venta de los productos al cliente a través de pre-vendedores,

distribuidores autorizados, auto-venta y call center.

CANAL: Canal al cual pertenece el cliente.

SPRDAT: Fecha de salida del cliente de la lista de clientes de Coca-Cola FEMSA.

NEVERAS: Número de neveras que tiene el cliente (provistas por FEMSA).

PUERTAS: Número de puertas totales que tienen las neveras.

LONGITUD: Distancia expresada en grados entre el meridiano del cliente y el meridiano de

Greenwich a lo largo de la línea ecuatorial.

LATITUD: Distancia expresada en grados entre la posición geográfica del cliente y la línea

ecuatorial.

Adicionalmente, se posee información sobre todas las transacciones de bebidas Powerade durante

el período comprendido entre enero del 2012 y junio del 2015, con los siguientes datos:

FECHA: Fecha de la transacción: año, mes y día.

LOCACION: Variable binaria que registra si el cliente se encuentra al sur de la calle 13 o al

norte de esta.

ARTNAM: Nombre de referencia del producto Powerade pues este tipo de bebida ofrece

varios sabores.

ARTNUM: Número de la referencia del producto.

TRANSACCIONES: Número de unidades compradas por cliente.

La información provista por FEMSA Colombia incluye datos sobre lugares que podrían afectar el

volumen de ventas del establecimiento, por ejemplo parques o gimnasios:

NOMBRE: Nombre del sitio de interés.

CATEGORIA: Tipos de sitio de interés clasificados en 14 categorías.

LONGITUD: Distancia expresada en grados entre el meridiano del sitio de interés y el

meridiano de Greenwich a lo largo de la línea ecuatorial.

Page 7: Caso de Estudio: Powerade

7

LATITUD: Distancia expresada en grados entre la posición geográfica del sitio de interés y la

línea ecuatorial.

Con el fin de asociar a los clientes con los sitios de interés se ha identificado el número de sitios de

interés de cada categoría que se encuentran a 250, 500, 750 y 1000 metros. Por ejemplo COLE 1000

representa el número de colegios localizados a menos de mil metros del cliente. También se ha

identificado con base en las transacciones, los días que han pasado desde el último pedido de un

cliente. En adición, se transforman algunas variables, las puntuaciones RFM y RFMM mediante el

análisis por componentes principales para obtener dos de ellos.

El data set final contiene la siguiente información adicional a data set la inicial:

Recencia: Número de días transcurridos desde la última compra del cliente.

Frecuencia: Número de transacciones promedio del año.

Monetario: Cantidad de unidades transadas en el último año.

Media Monetaria: Cantidad promedio de unidades transadas en el último año.

RP: Puntaje de recencia de acuerdo al análisis RFM.

FP: Puntaje de frecuencia de acuerdo al análisis RFM.

MP: Puntaje de monetario de acuerdo al análisis RFM.

MMP: Puntaje de la media monetaria de acuerdo al análisis RFM.

Componente 1: Puntaje asignado al cliente para ser proyectado en el primer componente de

Componentes Principales.

Componente 2: Puntaje asignado al cliente para ser proyectado en el segundo componente

de Componentes Principales.

Cluster: Agrupación a la cual pertenece el cliente.

Metodología Aplicada

RFM

El análisis RFM se basa en asignar a cada cliente una puntuación de 1 a 5 en los siguientes factores:

recencia (R), frecuencia (F) y monetario (M). La puntuación en cada factor se determina ordenando a

los clientes en función de su desempeño con el objetivo de asignar a los quintiles puntuaciones de 5

a 1 de mejor a peor.

Es importante resaltar que la puntuación de cada factor es independiente de los otros. Como los

clientes pueden ser exitosos en dos dimensiones diferentes, ya sea por la cantidad de unidades

adquiridas, ya sea por la rotación del inventario, se realiza un análisis paralelo que consiste en

cambiar el factor monetario (M) por el factor media monetaria (MM) a fin de tener en cuenta la

segunda dimensión de éxito.

Los factores de los análisis RFM y RFMM son los siguientes:

Recencia: Cantidad de días transcurridos desde la última compra.

Frecuencia: Número de pedidos durante un período de tiempo.

Page 8: Caso de Estudio: Powerade

8

Monetario: Cantidad de unidades adquiridas durante un período de tiempo.

Media Monetaria: Promedio de unidades adquiridas.

Como resultado del análisis RFM, a cada observación se le asignan cuatro (4) puntuaciones, una por

cada factor evaluado. Adicionalmente, se asignan dos puntuaciones que combinan la puntuación de

algunos factores en un único valor. Recencia, Frecuencia y Monetario para RFM y Recencia,

Frecuencia y Media Monetaria para RFMM. El resultado debe leerse de la siguiente manera: A más

alto sea el valor de la puntuación combinada, mejor será la observación. En total, resultaron 125

combinaciones diferentes de puntaje para RFM y 125 para RFMM. Con base en la aplicación del

análisis, la calificación más alta la obtienen las observaciones con puntaje de 555.4

Clúster (Análisis de conglomerados)

El Clustering consiste en hallar sub-grupos en un data set. Los grupos se organizan de tal manera que

las observaciones similares entre ellas y son diferentes a los otro sub-grupos. Es de recordar que los

clústers cubren todo el rango y no se intersecan entre ellos. Es decir que ninguna observación puede

pertenecer a dos clusters y todas las observaciones pertenecen a algún clúster.

El K medias Clustering, previo al algoritmo, determina el número de Clúster (K) resultantes. El

algoritmo busca minimizar la varianza entre las observaciones de cada clúster. El algoritmo se

desarrolla en tres pasos: Primero, asigna cada observación uno de los clústers de manera aleatoria.

Segundo, calcula el centroide de cada clúster y tercero, asigna a cada observación al clúster más

cercano por distancia Euclidiana al centroide. Los pasos 2 y 3 se repiten hasta que las observaciones

no cambien de clúster.5

Al final del algoritmo cada observación pertenecerá a un único clúster junta a sus similares.

Componentes Principales

El análisis de Componentes Principales permite resumir varias variables altamente correlacionadas a

un menor número de ellas que explican la mayor parte de la variabilidad de los datos del set original.

Este análisis se realiza sobre las variables independientes y no sobre las variables dependientes por

lo que se considera un método no supervisado. El primer componente es el hiperplano que mejor

explica la varianza de las variables por lo que minimiza la distancia Euclidiana, al hiperplano de cada

observación. El segundo componente encuentra el siguiente hiperplano ubicado más cerca de los

datos con base en la distancia Euclidiana y a su vez explica la siguiente mayor varianza. Esto significa

que se realiza una transformación de los datos para encontrar las dimensiones que mejor explican el

comportamiento de las observaciones.6

4 Ver: IBM SPSS Direct Marketing 20.

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/es/client/Manuals/IBM_SPSS_Dir

ect_Marketing.pdf

5 Ver: James Gareth et alt: “An introduction to Statistical Learning”. Ed. Spinger 2014, pág. 385

6 Ver: James Gareth et alt: “An introduction to Statistical Learning”. Ed. Spinger 2014, págs. 256,380.

Page 9: Caso de Estudio: Powerade

9

Al realizar Componentes principales se reduce la dimensionalidad del problema y permite realizar

otros procesos de manera más sencilla, como es, la interpretación de las características de un

clúster.

GAMs (Modelo Predictivo)

Este es un modelo aditivo generalizado, GAMs, por sus siglas en inglés que calcula la suma de las

influencias de cada variable independiente en la variable dependiente.

El modelo permite superar la linealidad al evaluar funciones no lineales para cada variable. Estas

funciones son llamadas cubic splines pues crean polinomios de grado 3 en varios rangos del dominio

de la variable. El número de rangos es definido con grados de libertad los cuales se utilizan para

calibrar el modelo. En consecuencia, a mayor grado de libertad mayor número de particiones en el

rango de la variable lo que resulta en mayor número de cubic splines. Un mayor número de cubic

splines aumenta la flexibilidad del modelo al ajustarlo a las observaciones con mayor precisión.

Una de las grandes ventajas que tiene el modelo es que al ser aditivo se puede apreciar la influencia

de cada variable independiente en la variable de respuesta.

Resultados Obtenidos

Con el fin de hacer comprensible la aplicación de la metodología y evitar una presentación extensa

se explican a continuación los resultados generales en todos los canales y para resultados

específicos se muestran para el canal Tiendas de Barrio.

RFM

Al aplicar el análisis RFM y RFMM se logró calificar el desempeño de los clientes. Los resultados en

RFM muestran que más del 10% de los clientes en los cuatro (4) canales estudiados recibieron

puntuación perfecta, mientras que en RFMM ningún canal superó este porcentaje de clientes. En

ambos análisis, el canal Mini-mercados registra mayor porcentaje de clientes con puntuación 555

siendo las Tiendas de Barrio las que obtienen el porcentaje mas bajo.

A partir de resultados del análisis RFM y RFMM se concluye que el RFMM es un análisis más exigente

por cuanto reduce al 50% la cantidad de clientes con puntuación perfecta identificados en el análisis

RFM. De todas formas, es importante señalar que no solamente los clientes con puntuaciones

perfectas son aquellos exitosos. (Ver Tabla 1).

Page 10: Caso de Estudio: Powerade

10

Tabla 1. Puntuaciones Perfectas por Canal, RFM y RFMM

Canal Puntuación Perfecta Porcentaje Factores

Cigarrería / Licorería 157 11.28% Recencia Frecuencia Monetario

Mini-mercados 445 24.28%

Panadería 328 10.59%

Tiendas de Barrio 651 10.48%

Cigarrería / Licorería 66 4.74% Recencia Frecuencia

Media Monetaria

Mini-mercados 177 9.66%

Panadería 117 3.78%

Tiendas de Barrio 208 3.35%

Clústers

Al segmentar a los clientes se identificaron vecinos comportamentales y características comunes. A

partir de los puntajes de RFM y RFMM se realizó el análisis de conglomerados para cada uno de los

canales por lo que se encontraron los clúster con mejor desempeño, la cantidad de clientes en cada

uno de ellos y su ubicación geográfica en el mercado de Bogotá.

Se presenta a continuación como ejemplo del análisis, los resultados del canal Tiendas De Barrio:

En la tabla 2 con base en el análisis RFM, se observa que el Cluster 3 es definitivamente el mejor por

presentar puntuaciones más altas en R (4.59), F (4.6) y M (4.58). Esto quiere decir que los clientes

del clúster 3 han realizado la última compra en un período menor de días, en relación con la que

registran los demás, tienen mayor frecuencia de compras y mayor cantidad de unidades tranzadas

en el año estudiado. A su vez, el Cluster 4 registra la segunda mayor puntuación en F (4.07) y M, la

segunda mayor (4.09), lo que significa que los clientes del clúster 4 demandan con mayor frecuencia

y mayor cantidad. Es de anotar que los clientes de este clúster realizaron la última compra en un

período de tiempo mayor al registrado para los clúster 3, 5 y 1.

Tabla 2. Resultados de Conglomerados. Canal Tiendas de Barrio RFM

Cluster R F M

1 2.57 2.31 2.2

2 1.24 2.48 2.44

3 4.59 4.6 4.58

4 2.5 4.07 4.09

5 4.25 2.58 2.49

En la tabla 3, con base en el análisis RFM, se observa que el Cluster 3, además de tener las mejores

puntuaciones tiene el mayor número de clientes. En tanto, el clúster 4 agrupa el 14.2% de los

clientes pertenecientes al canal Tiendas de Barrio y se ubica como el segundo clúster más pequeño.

A pesar de haber encontrado dos clúster, 3 y 4, con buenas puntuaciones RFM, en el clúster 4 se

agrupan menos de la mitad de clientes con respecto al clúster 3.

Page 11: Caso de Estudio: Powerade

11

Tabla 3.Tamaño de Conglomerados. Canal Tiendas de Barrio RFM

Cluster Frecuencia %

1 1284 20.7%

2 1551 25.0%

3 1922 30.9%

4 882 14.2%

5 574 9.2%

En la figura 7 se muestra la distribución de los clientes del clúster 3 analizado con RFM para el canal

de Tiendas de Barrio. Se puede apreciar una mayor concentración de clientes del clúster 3 al

Noroccidente de la localidad de Kennedy mientras que al occidente de Teusaquillo no se

evidenciaron clientes de este clúster.

Figura 7. Localización de Clúster 3 RFM. Canal Tiendas de Barrio.

En la tabla 4 con base en el análisis RFMM se observa que el clúster 4 presenta los mejores valores en

R (4.21), F (4.35) y MM (4.48) si bien ocupa el segundo lugar en R y F tiene la mejor puntuación en

MM mientras que el clúster 5, si bien tiene las mejores puntuaciones en R (4.6) y F (4.58) presenta la

más baja calificación en MM (1). Esto significa que los clientes del clúster 4 son los mejores en todos

los factores por cuanto el clúster 5 a pesar de estar mejor punteado en recencia y frecuencia, en

promedio realiza adquisiciones de pocas unidades (MM=1).

Page 12: Caso de Estudio: Powerade

12

Tabla 4. Resultados de Conglomerados. Canal Tiendas de Barrio RFMM

Cluster R F MM

1 1.3 2.2 1.91

2 2.72 2.76 3.13

3 2.73 3.47 1

4 4.21 4.35 4.48

5 4.6 4.58 1

Con base en el análisis RFMM, en la tabla 5 se evidencia que la mayor cantidad de clientes se

encuentra en el Cluster 4 (34%) mientras que esta cantidad es menor en el Cluster 5 (7%). Esto indica

que la mayor parte de los clientes de Tiendas de Barrio pertenecen a uno de los clústers mejor

calificados, el 4 de RFMM, mientras que los clientes del clúster 5 son relativamente pocos.

Tabla 5.Tamaño de Conglomerados, Canal Tiendas de Barrio RFMM

Cluster Frecuencia %

1 1582 25.5%

2 1688 27.2%

3 365 5.9%

4 2118 34.1%

5 460 7.4%

La localización de los clientes del canal Tiendas de Barrio según el análisis RFMM se distribuyen en

Bogotá como se presenta en la Figura 8. Se podría concluir que los clientes tienden al concentrarse

en el occidente de Bogotá y que hay zonas de la ciudad donde ciertos canales se destacan sobre

otros. De todas formas es preciso señalar que con esta sola información no es posible llegar a

conclusiones más certeras por cuanto algunas mayores densidades de los puntos podrían explicarse

en una mayor densidad poblacional o de edificaciones en altura en algunas zonas de la ciudad.

Page 13: Caso de Estudio: Powerade

13

Figura 8. Localización de Clúster RFMM. Canal Tiendas de Barrio.

De otra parte, también se concluye que, a partir del análisis RFMM no existen clúster que se

destaquen de manera significativa sobre el resto. En contraste, en el análisis RFM es posible

identificar los clúster que sobresalen con respecto a otros. La no predominancia de un clúster sobre

otros en el análisis RFMM se explica en la existencia de dos dimensiones de éxito: 1) clientes con

grandes volúmenes de compra, frecuencia media y recencia baja y 2) clientes con bajo volumen de

compra y frecuencia y recencia altas.

Componentes Principales

En el primer componente se define por el comportamiento de los cuatro factores R, F, M y MM . Esta

medición se interpreta de la siguiente manera: a menor valor asignado al clúster, el volumen de

compras es mayor, debido a que los valores de los factores del componente son negativos. Según los

resultados de este componente, se presenta un comportamiento diferente al resto en el canal de

Panaderías donde su valor es directamente proporcional al volumen de ventas. (Ver tabla 6). Se

asocia este componente a la primera dimensión de éxito.

En el segundo componente se define por el comportamiento de los tres factores R, F, y MM. No se

tiene en cuenta el factor M debido a que este componente se ve modificado por la cantidad de

compras realizadas durante el año estudiado. Esta medición se interpreta de la siguiente manera: si

el valor de este componente es mayor, el clúster tendrá una mayor rotación de inventario. Según los

resultados en este componente, se presentan comportamientos diferentes en los canales de

panadería y de licorería/cigarrería. En el caso del canal panadería no se tiene en cuenta el factor de

frecuencia (F). En licorería/cigarrería el valor resultante del clúster es inversamente proporcional a

un buen desempeño en recencia (R) y frecuencia (F). (Ver Tabla 7). Se asocia este componente a la

segunda dimensión de éxito.

Page 14: Caso de Estudio: Powerade

14

Tabla 6. Coeficientes de Primer Componente por Canal.

Componente Principal 1 R F M MM

Tiendas de Barrio -0.533 -0.469 -0.506 -0.49

Mini-mercados -0.514 -0.537 -0.565 -0.358

Panadería 0.522 0.457 0.493 0.525

Licorería / Cigarrería -0.544 -0.457 -0.499 -0.497

Tabla 7. Coeficientes de Segundo Componente por Canal.

Componente Principal 2 R F M MM

Tiendas de Barrio 0.579 0.152

-0.801

Mini-mercados 0.365 0.199

-0.908

Panadería 0.687

-0.722

Licorería / Cigarrería -0.576 -0.153

0.802

Según los resultados de la Tabla 8. para el caso de las Tiendas de Barrio los clústers 1 y 2 tienen peor

desempeño en los dos componentes. El clúster 3 se asocia con clientes pequeños con alta rotación

de inventario mientras que el 4 se asocia con Tiendas grandes las cuales tienden a realizar pedidos

más grandes. El clúster 4 tiene más del doble de clientes que el clúster 3 y agrupa el mayor número

de clientes por más del doble al clúster 3. Sin embargo la suma de los clientes de los clusters menos

exitosos es mayor a la suma de los clusters de clientes exitosos.

Tabla 8. Clústers. Canal Tienda de Barrio y sus Componentes.

Clusters: Tienda de Barrio Componente 1 Componente 2 Tamaño

1 2.5475 0.1612 1851

2 0.3807 -0.8027 1691

3 -0.5910 2.2812 715

4 -2.5238 -0.2924 1956

Modelamiento

Se aplica siete (7) modelos GAMs diferentes, uno para cada dimensión de éxito por cada canal a

excepción de canal Mini-mercados por cuanto este solo cuenta con una dimensión de éxito.

El entrenamiento del modelo GAMs se realizó aplicando el método de 10 Fold Cross Validation variando

los grados de libertad entre 5 a 15. Se realizaron dos pruebas de eficiencia fin de validar el modelo.

En el modelo la variable X0 corresponde a las tiendas no exitosas y la variable X1 a las exitosas. El modelo

presenta dos tipos de errores: clasificar un cliente no exitoso como exitoso (falso positivo) y un cliente

exitoso como no exitoso (falso negativo). La proporción entre los dos tipos de errores fue controlada

definiendo un threshold, entendido como la probabilidad mínima para calificar un cliente como exitoso,

al cual le fue asignado un valor de 0.7. Los dos tipos de errores y los aciertos se muestran en la matriz de

Page 15: Caso de Estudio: Powerade

15

confusión del canal Tienda de Barrio en la segunda dimensión de éxito: clientes con bajo volumen de

compra y frecuencia y recencia altas. (Ver Tabla 9).

Tabla 9. Matriz de Confusión. Canal Tiendas de Barrio en Segunda Dimensión de Éxito.

X0 X1

FALSO 231 189

VERDADERO 705 162

De otra parte, se evaluó el desempeño de los modelos bajo el criterio de Área bajo la curva. La forma en

que este criterio se lee es que a mayor área bajo la curva, mejor será el modelo. Esto equivale a decir que

las variables que el modelo ha determinado como significativas influyen realmente en el éxito de los

clientes.

Es importante señalar que la gráfica muestra sensibilidad en el eje de la Y y (1- especificidad) en el eje de

la X. Adicionalmente, en la gráfica se incluye una recta de pendiente 1 con un área bajo la curva de 0.5,

recta que representa un modelo equivalente a lanzar una moneda para determinar el éxito del cliente.

Esto significa que una mayor distancia de la curva arriba de la recta, indica que el desempeño del modelo

es mejor. El threshold es máximo en la parte izquierda de la gráfica mientras que en la parte derecha es

igual a cero (0). La Figura 9 muestra la gráfica del área bajo la curva del modelo para el canal Tienda de

Barrio en la segunda dimensión de éxito. Se aprecia que la curva se mantiene arriba de la recta durante

todo el rango y aumenta su distancia a ella en thresholds altos.

Figura 9. Área Bajo la Curva. Canal Tiendas de Barrio en Segunda Dimensión de éxito

Los resultados de aplicación del criterio Área bajo la curva muestran que los modelos de la segunda

dimensión de éxito de los canales Tiendas de Barrio, Panaderías y Licorería/Cigarrería tienen un

Page 16: Caso de Estudio: Powerade

16

mejor desempeño respecto a los modelos de la primera dimensión de éxito. Por su parte, el modelo

de Mini-mercados presenta el mejor desempeño, seguido del modelo de la segunda dimensión de

éxito del canal Tiendas de Barrio. El modelo con más bajo desempeño es la primera dimensión de

éxito del canal Panadería que presenta un área bajo la curva menor a 0.5, por lo que sus resultados

no deben tenerse en cuenta. (Ver tabla 10).

Tabla 10. Área Bajo la Curva de los 7 modelos.

ÁREA BAJO LA CURVA

CANALES 1ª Dimensión de éxito 2ª Dimensión de éxito

Tienda de Barrio 0.5784 0.7033

Mini-mercado 0.7054 -

Panadería 0.4656 0.632

Licorería / Cigarrería 0.5172 0.6301

El resultado del modelo GAMs para Tiendas de Barrio en la segunda dimensión de éxito evidencia las

siguientes variables como significativas: i) Oro y ii) Plata, siendo plata la más determinante entre las

dos. Estas clasificaciones corresponden a las definidas por Coca-Cola FEMSA para sus clientes según

la cantidad de productos Coca-Cola adquiridos por estos. De otra parte, también se encuentran las

variables de iii) estrato social I, iv) estrato social II y v) estrato social III, siendo el estrato social II el

más determinante. Como se explicó atrás aquí se define el estrato dominante en el entorno del

establecimiento del cliente, lo cual se desprende de la estratificación incluida en las facturas de

servicios públicos.

Se presentan igualmente otras variables como: v) número de neveras, vi) número de puertas. Otras

variables significativas encontradas respecto a la localización fueron vii) latitud, viii) longitud, y

cercanía a ix) hospitales, x) bibliotecas, xi) colegios y xii) centros comerciales. Es de recordar que

todas las variables de cercanías se expresan con el nombre de la categoría del sitio de interés

seguida de un número. En esta denominación se representan el número de sitios de interés de esa

categoría a la distancia expresada en metros. Las cuatro (4) variables de mayor influencia son la

Latitud, Oro, Plata y Estrato II lo que significa que un cliente que pertenezca a estas categorías y

tenga una Latitud alta tiene mayor probabilidad de ser calificado como un cliente exitoso. (Ver tabla

11).

Page 17: Caso de Estudio: Powerade

17

Tabla 11. Coeficientes del Modelo GAMS para Tiendas de Barrio. Segunda dimensión de éxito

GAMS TIENDAS DE BARRIO

Variable Coeficiente Splines

Intercepto -48.33 No

Oro 1.99 No

Plata 0.76 No

Estrato I 0.16 No

Estrato II 0.37 No

Estrato III 0.31 No

Hospitales 750 0.09 No

Hospitales 500 -0.47 No

Bibliotecas 1000 -0.32 No

Bibliotecas 750 0.26 No

Número de Neveras -0.11 No

Número de Puertas 0.34 No

Colegios 250 -0.01 Si

Colegios 500 -0.02 Si

Colegios 750 0.05 Si

Colegios 1000 -0.04 Si

Centro Comercial 750 0.26 Si

Centro Comercial 1000 0.15 Si

Longitud -0.42 No

Latitud 3.24 No

De los 7 modelos GAMs diseñados se concluye que sólo dos modelos, Mini-mercados y Tiendas de

Barrio de la segunda dimensión de éxito, permiten contar con información que le permita a Coca-

Cola- FEMSA mejorar su inserción en el mercado.

Conclusiones

A pesar de la buena aproximación lograda con la aplicación de la metodología a los datos puestos a

disposición para el presente estudio de caso, se concluye que es necesario realizar un mejor

modelamiento con un mayor nivel predictivo que permita lograr el objetivo planteado de aumentar

al 21% la participación del productos Powerade de Coca-Cola FEMSA en el mercado de Bogotá.

El análisis RFM es un buen método para asignar puntajes que soporten la segmentación de los

clientes. Sin embargo, al tener un número tan elevado de clientes por calificar, se presentan fallas en

este análisis. Es así que cuando todos clientes del mismo canal son calificados sin tener en cuenta,

Page 18: Caso de Estudio: Powerade

18

por ejemplo, su localización o el estrato social dominante en su entorno, se puede calificar de

manera errónea a un cliente. Vale decir que un cliente que tiene un buen puntaje RFM respecto a

otros clientes con características similares, sea calificado con bajo desempeño frente a todo el set de

clientes. En estas circunstancias, sería conveniente realizar una segmentación previa al análisis RFM.

Este mismo razonamiento se puede realizar para RFMM.

El clustering resulta ser una buena herramienta para separar la muestra en clúster de clientes con

características similares por su puntuación RFM y RFMM. Si bien en la aplicación de esta herramienta

no se realizó sobre variables como la localización geográfica y ni la estratificación, esto parece ser

conveniente a fin de lograr resultados que permitan diseñar mejores estrategias para Coca-Cola

como por ejemplo, marketing diferenciado y aplicar metodologías más precisas a los agrupaciones

encontradas.

El modelamiento a través de GAMs es un método eficiente para encontrar en qué medida influencia

cada variable en el éxito de los clientes. Con el fin de obtener mayor información se deberían

realizar nuevos modelos reduciendo las variables de entrada para determinar la influencia de

algunos factores, sin tener en cuenta otros que pueden estar atrapando gran parte de la varianza

pero que ofrecen poca información. Es el caso de la calificación oro asignada al cliente pues esta ya

informa sobre la alta cantidad de productos adquiridos.

También es de señalar que el modelo GAMs, por su naturaleza aditiva, no tiene en consideración

interacciones entre variables que podrían ser importantes, como la combinación entre Latitud y

Longitud. Sin embargo, este inconveniente puede ser superado aplicando otros modelos que tengan

en consideración interacciones, sacrificando la interpretación. Así, las interacciones significativas

pueden agregarse al modelo GAMs original para incluir y determinar su influencia.

Por su parte, el análisis de Componentes Principales permite determinar el éxito de los clientes en

dos dimensiones diferentes que son fácilmente interpretables y cuantificables gracias a los puntajes

RFM RFMM. Este análisis se presenta como la mejor aproximación para estimar las dos dimensiones

de éxito señaladas en este caso de estudio: 1) clientes con grandes volúmenes de compra,

frecuencia media y recencia baja y 2) clientes con bajo volumen de compra y frecuencia y recencia

altas.

Propuesta de desarrollos futuros

Teniendo en cuenta que los estratos 2 y 3 son aquellos donde se registra un mayor número de

ventas totales y un menor número de ventas promedio, podría de interés para Coca-Cola FEMSA

realizar un estudio dirigido a estos estratos. Con los nuevos resultados podrían realizarse campañas

publicitarias en zonas donde predominan estos estratos, enfatizando el hecho de que Powerade

tiene un precio menor al de su mayor competidor Gatorade y así explotar esta ventaja competitiva7.

Igualmente, se podrían segmentar los clientes por zonas geográficas, dado que las diferencias socio-

económicas entre zonas de la ciudad pueden ser una variable significativa. También podrían

tomarse en consideración variables como la densidad poblacional y constructiva, en ciertas zonas

entre otras variables que pueden marcar la diferencia en el comportamiento de los clientes respecto

7 Según reunión realizada con representantes de la empresa el 19 de agosto de 2015

Page 19: Caso de Estudio: Powerade

19

al mercado de bebidas isotónicas. Otra variable importante que no fue considerada se relaciona con

la localización de los clientes en la ciudad de Bogotá, es la presencia de publicidad Powerade. Se

parte del supuesto de que una mayor cantidad de publicidad en ciertas zonas de la ciudad explicaría

mayores adquisiciones de clientes allí ubicados, frente a menores adquisiciones por parte de otros

donde la publicidad es escasa o inexistente.

Además, estudios futuros deben tener en cuenta la competencia de Powerade por parte de otras

bebidas isotónicas. Podría ser de gran valor contar con información sobre los comportamientos de la

competencia para compararlos con las bebidas isotónicas de Coca-Cola FEMSA. Si los mercados

fuesen similares, la firma debería centrarse en llegar a mercados diferentes, no atendidos. Si la

competencia atendiera también otro nicho del mercado, Powerade no sólo debería llegar al

mercado desatendido sino entender también las razones que explican su ausencia en el mercado de

la competencia. De la mano, se debería de realizar encuestas de satisfacción y un piloto, con el

objetivo de obtener resultados para realizar nuevos análisis para problemas supervisados y así

conocer si las estrategias aplicadas son efectivas.

En conclusión la metodología aplicada en el caso de estudio tiene fuerte fundamento teórico y los

modelos de Mini-mercados y Tiendas de Barrio en la segunda dimensión de éxito son confiables. Sin

embargo hay muchas otras oportunidades para aplicar la misma metodología con las variaciones

antes señaladas y en consecuencia, obtener más y mejor información.