Business Intelligence en la Industria de Retailing: Pronóstico de Ventas con Redes Neuronales y su Uso en la Reposición de Inventarios de un Supermercado Luis Aburto Lafourcade Magíster en Gestión de Operaciones, U. de Chile Marco Halabi Bassano Gerente de Operaciones, Economax
Agenda Economax y la Industria Motivación del Problema Objetivos y Alcances del Proyecto Metodología KDD Enfoques de Solución Modelos Estadísticos: ARIMA Redes Neuronales: MLP Aplicación a la Reposición de Inventarios Conclusiones
La industria de Supermercados Megamercados Inversión de capitales extranjeros Alta competencia en el rubro Entre 5.000 y 60.000 Prod.
Economax Cadena de supermercados con 10 locales. Orientado a segmentos de ingresos medios, medios-bajos de la población. Ventas anuales por más de 50 MMUS$ que corresponden aprox. al 3% de las ventas en Región Metropolitana.
Motivación del Problema Flujo de Productos ¿Qué productos pido? ¿Cuánto pido? Flujo de Información Necesidad de pronóstico de ventas en el corto plazo
ECR (Efficient Consumer Response) Es una estrategia de la cadena en conjunto para mejorar el servicio a los consumidores. Introducción Eficiente de Productos Surtido Eficiente Promoción Eficiente Reposición Eficiente:proveer el producto correcto, en el lugar correcto, en la cantidad correcta y de la forma más eficiente posible.
Motivación del Problema Ventas ... De qué dependen? Ventas pasadas Precios Campañas Publicitarias Estacionalidad Festivos Clima Venta de productos similares 5.000 10.000 15.000 20.000 25.000 30.000 01-01-1998 08-01-1998 15-01-1998 22-01-1998 29-01-1998 05-02-1998 12-02-1998 19-02-1998 26-02-1998 05-03-1998 12-03-1998 19-03-1998 26-03-1998 02-04-1998 09-04-1998 16-04-1998 23-04-1998 30-04-1998 Día Monto ($)
Motivación del Problema ¿Cómo administrar el inventario? Muy poco Quiebres de Venta. Clientes insatisfechos Mucho Costos de capital Desarrollar mejores técnicas de pronóstico y de acuerdo a esto gestionar nuestro inventario Aplicaciones exitosas con Redes Neuronales (ICA Handlarna Suecia, Cadena farmacéutica EE. UU.) Existen las tecnologías y conocimientos
Objetivos y Alcances del Proyecto Desarrollar un sistema de pronóstico de ventas para mejorar la reposición de inventarios de la cadena de supermercados Esto permitirá disminuir: los costos de capital inmovilizado en inventarios las ventas perdidas (mejorar el nivel de servicio entregado a los clientes) Se acotará el ámbito de estudio a: Local La Pintana, 4500 m2 Subconjunto de productos:50 productos más vendidos en el local (representan el 23,18% de las ventas) Con datos desde el 12/09/2000 a 31/07/2001
Knowledge Discovery in Databases: KDD (Fayyad et al, 1996) 2.Selección y Preprocesamiento 4.Interpretación y Evaluación Knowledge p(x)=0.02 Warehouse Fuentes de Datos Patrones y Modelos Datos preparados Datos Consolidados 3.Data Mining 1.Consolidación de los Datos Conocimiento DW
1.Consolidación de los Datos Datos de diferentes fuentes: ORION Unidades Vendidas en local La Pintana desde 01/07/00 al 31/07/01 para los 50 PLU’s más vendidos AC Nielsen Precios semanales de los productos en el local de estudio y la competencia del micromercado (Santa Isabel, Ekono y Lider)
1.Consolidación de los Datos: Café 170 grs. Verano
1.Consolidación de los Datos: Cerveza 1 Lt. 18 Sept Año Nuevo Navidad Verano
1.Consolidación de los Datos Características del día. Variables binarias {0,1} pago :Días de pago de fin de mes. quincena :Días de pago de quincena prefest :Días anteriores a feriados feriado :Días festivos patrias :Días de fiestas patrias santa :Días de semana santa vacation :Días de vacaciones (Enero y Febrero) verano :Días de meses estivales (desde 01/10 al 31/03) a_nuevo :1 de Enero. Único día del año donde los supermercados no venden.
Knowledge Discovery in Databases: KDD (Fayyad et al, 1996) 2.Selección y Preprocesamiento 4.Interpretación y Evaluación Knowledge p(x)=0.02 Warehouse Fuentes de Datos Patrones y Modelos Datos preparados Datos Consolidados 3.Data Mining 1.Consolidación de los Datos Conocimiento DW
2.Selección y Preprocesamiento “En la vida real los datos no están como quisieramos” De los 50 PLU’s originales hay 3 correspondientes a promociones De los 47 PLU’s restantes 9 presentan ausencia de datos de más del 25% en la serie de tiempo LIMPIEZA DE DATOS!!!
2.Preprocesamiento Las ventas se escalaron entre 0 y 1 En base a los precios se crean las siguientes variables: PA(Nºprod)=precioProd_Economax
Knowledge Discovery in Databases: KDD (Fayyad et al, 1996) 2.Selección y Preprocesamiento 4.Interpretación y Evaluación Knowledge p(x)=0.02 Warehouse Fuentes de Datos Patrones y Modelos Datos preparados Datos Consolidados 3.Data Mining 1.Consolidación de los Datos Conocimiento DW
3.Data Mining: Enfoques de Solución Modelos Ingenuos (enfoque actual) Modelos Box Jenkins SARIMAX (p,d,q) (sp,sd,sq) X Redes Neuronales Perceptrón Multicapas (MLP)
Modelos ARIMA Modelos lineales que agrupan: modelos autorregresivos AR(p) modelos de medias móviles MA(q) ARIMA(p,d,q) donde d es Nº de términos diferenciados Seasonal ARIMA: SARIMA (p,d,q) (sp,sd,sq) SARIMAX con X variables externas (regresores)
Redes Neuronales Modelos matemáticos no lineales que simulan a las neuronas A través de un ajuste de las conexiones (aprendizaje), se minimiza el error en la capa de salida
Aplicaciones de Redes Neuronales Clasificación: Detección de Fraude (Telefónica Chile) Predicción de Fuga de Clientes (BCI) Predicción de Compra de productos (marketing directo) (Telefónica Chile) Regresión: Estimación de riesgo de clientes (scoring) Pronóstico de índices financieros y bursátiles (monedas, metales, stock markets, bonos, etc.)
Perceptrón Multicapas (MLP) para pronóstico
Overfitting o Sobreajuste Sobreajuste de la red a los datos del problema y no al problema en sí Conjuntos de Entrenamiento y de Testeo
ARIMA v/s MLP
Desempeño del pronóstico: medidas de error Error Porcentual (Error porcentual absoluto medio) Error Normalizado (Error cuadrático medio normalizado)
Aplicación a PLU 100595 (Aceite Vegetal 1 Lt Aplicación a PLU 100595 (Aceite Vegetal 1 Lt.) Modelo ARIMA (1,0,0)(2,0,0) Number of residuals 316 Standard error 21.788166 Log likelihood -1418.0542 AIC 2856.1083 SBC 2893.6658 Analysis of Variance: DF Adj. Sum of Squares Residual Variance Residuals 306 146174.83 474.72420 Variables in the Model: B SEB T-RATIO APPROX. PROB. AR1 .417463 .051085 8.1719215 .00000000 SAR1 .130165 .055043 2.3647876 .01866427 SAR2 .295255 .055631 5.3073729 .00000021 PAGO 51.980466 5.876780 8.8450596 .00000000 PREFEST 27.948165 6.911996 4.0434291 .00006672 FERIADO 25.081074 6.947247 3.6102176 .00035735 SANTA 34.127746 17.129981 1.9922816 .04722842 PB100595 14.634096 8.306789 1.7617031 .07911801 PC100595 16.487375 8.888587 1.8548928 .06457326 CONSTANT 35.859236 5.626348 6.3734482 .00000000
Modelos Tradicionales y MLP
Resumen Producto 100595
En Resumen... Se realizaron pruebas con otros cinco productos, y se obtuvo que: ARIMA mejora los pronósticos obtenidos por métodos ingenuos Se obtienen mejores resultados con Redes Neuronales que con ARIMA ARIMA entrega un modelo comprensible y buenos resultados, pero con costos no despreciables (requerimientos estadísticos y conocimientos de parte del usuario) Redes Neuronales obtienen los mejores resultados de forma más automática, pero con modelo tipo “black box”
Sistema de Pronóstico de Ventas ORION Chequeo de datos y corrección Unidades Vendidas Precios Promociones Datos limpios y verificados Parámetros: Tiempo de predicción Producto, local Modelo Predictivo Reentrenamiento con nuevos datos Pronóstico Pronóstico para el período deseado Sistema de Reposición de Inventarios Chequeo de Predicción
Sistema de Reposición de Inventarios Proveedor ORION Información de Proveedores: Tiempos de entrega Confiabilidad Orden de Compra via EDI Ajustes del tomador de decisiones Cuánto y/o Cuándo pedir Pronóstico para el período deseado Sistema de Pronóstico de Ventas
Sistema de Reposición Periódica Reposición cada P días, con tiempo de entrega de L días. INVENTARIO OBJETIVO T T=m’+z Con: m’: demanda promedio durante P+L días (del sistema de pronóstico) Z: stock de seguridad (nivel de servicio * desviación ventas)
Reposición de Inventarios
Resumen de Resultados El sistema de pronóstico alimenta a un sistema periódico de reposición de inventarios El Nivel de Inventario Objetivo es dinámico en el tiempo En base a las mejores predicciones se espera en términos promedios: reducción de quiebres en un 50% reducción de días de alcance en 10 días (Primera Etapa) Resultados fácilmente escalables a otros locales y otros productos (80/20 de los productos)
Resumen de Resultados Business Intelligence Se conoce qué variables afectan los patrones de compra de los distintos productos. Se puede cuantificar la magnitud de cada evento: feriados, fines de semana largos, fines de mes, entre otros. Revenue Management Se puede analizar el impacto de precios en la demanda futura de los productos: promociones eficientes. Category Management Interdependencia entre los patrones de venta de distintos productos (agrupar productos).