Primera sustentación Proyectos de Sistemas II Alcántara Mori, Alvaro Asesor : MBA Ing. Carlos Zorrilla Vargas
Planteamiento del Problema Carrera : Informática Área : Base de Datos Asignatura : Minería de Datos Tema : Implantación de un sistema de Minería de Datos.
2. Justificación de la Investigación
Objetivos Generales Conocer el impacto económico y en la alineación de los procesos al implantar un sistema de Minería de Datos, en la empresa DIPESA.
Objetivos Específicos Calcular la ganancia económica resultante después de la implantación. Reducción de 10% del costo del producto en logística. Caracterizar los procesos no atendidos adecuadamente, conocer su influencia.
Descripción del Problema La empresa DIPESA, dedicada a la comercialización de productos de primera necesidad. Tiene procesos básicos de comercialización y cuenta con un sistema de almacenes que solo gestiona parte de sus procesos.
Descripción del Problema Se ha visto perdidas por el mal ingreso de los datos en algunas de las áreas de sus procesos y gastos excesivos por el tema de almacenamiento. También ligeras perdidas de productos que exceden las fechas de vencimiento y que aun no han sido distribuidos.
Formulación del Problema Formulación de Minería de Datos para la Empresa Distribuidora de Productos Espinoza Aguilar S.A DISTRIBUIDORA DE PRODUCTOS ESPINOZA AGUILAR S.A.
Formulación del Problema Desde sus inicios la rentabilidad en las cuales está orientada la empresa, DIPESA, se basa en la cantidad de volumen comercializado, dejando de lado la investigación relacionada con las estadísticas y proyecciones. Generando gastos adicionales que bien se pueden reducir en las etapas de almacenaje y preferencias de clientes.
Hipótesis ¿La implantación de un Sistema de Minería de Datos, en la empresa DIPESA, logrará reducir los gastos logísticos de 25% a 15 %?
JUSTIFICACION ¿Por qué? Para detectar falencias en las los procesos que generen perdidas por gastos innecesarios en la logística. ¿Para qué? Para aumentar la rentabilidad del negocio y agilizar los procesos internos de comercialización en todas sus áreas.
LIMITACIONES Las limitaciones del estudio son dadas por la falta de cultura que tienen las medianas empresas en la inversión de proyecciones estadísticas y en la estructura cerrada de las compañías que por seguridad y estrategias comerciales limitan a nula la información de sus logros internos.
3. Situación Actual
RECURSOS CON LOS QUE CONTAMOS Sala de Ventas DIPESA Sala de Ventas REDIGOL Contamos con: 04 Vendedores canal Vertical 30 Vendedores canal Horizontal 05 Vendedores Viajeros SALAS DE VENTA Y VENDEDORES Contamos con el sistema comercial Este nos otorga información detallada acorde con las necesidades del momento SISTEMAS INFORMATICOS Contamos con 13 vehículos propios entre camiones, camionetas , minibuses y combis bajo la administración y control de nuestra Empresa CHZ Servicios Corporativos SAC. OPERADOR DE TRANSPORTE PROPIO
Provincias de Huancavelica, Pampas, Tayacaja y Lircay ZONAS DE OPERACION Provincias de Huancayo, Chupaca, Concepción, Jauja, Yauli – La Oroya, Tarma, Chanchamayo y Satipo REGION JUNIN REGION HUANCAVELICA Provincias de Huancavelica, Pampas, Tayacaja y Lircay
VENDEDORES Y CARTERA DE CLIENTES LINEAS DE PRODUCTOS LINEAS DE PRODUCTOS LINEAS DE PRODUCTOS 20 VENDEDORES 20 VENDEDORES 06 VENDEDORES 14 Vendedores cobertura 01 Vendedor mayorista 01 Vendedor mini mayorista 01 Vendedor mercados 03 Vendedores viajeros 14 Vendedores cobertura 01 Vendedor mayorista 01 Vendedor mini mayorista 01 Vendedor mercados 03 Vendedores viajeros 02 Vendedores cobertura 01 Vendedor mayorista 02 Vendedores Selva central 01 Vendedor Boticas, Farmacias Cartera 4,890 Clientes Cobertura 3,800 Clientes Zonas de atención Huancayo, Chupaca, Concepción, Jauja, Yauli – La Oroya Cartera 4,890 Clientes Cobertura 3,800 Clientes Zonas de atención Huancayo, Chupaca, Concepción, Jauja, Yauli – La Oroya Cartera 350 Clientes Cobertura 285 Clientes Zonas de atención Provincias de Tarma, Chanchamayo y Satipo Cartera 350 Clientes Cobertura 285 Clientes Zonas de atención Pampas , Huancavelica y Lircay Cartera 350 Clientes Cobertura 285 Clientes Zonas de atención Pampas , Huancavelica y Lircay
Marco Teórico
La Minería de Datos es un campo multidisciplinario
Proceso que abarca la Minería de Datos
Etapas Selección de los datos de entrada. Transformación de los datos de entrada. Minería de datos. Interpretación de los resultados obtenidos.
Extracción / Integración Preparación de datos Extracción / Integración Transformación Selección Limpieza Data warehouse 50-80% tiempo del proyecto
“Scrubbing, selecting, cleansing, preprocessing,…” Eliminar redundancia Eliminar datos y variables irrelevantes Tratar datos ausentes media, substitución astuta, interpolación, ignorar, ? Corrección errores Outliers (datos fuera de rango) Verificar consistencia Reservar todo pre procesamiento relevante hasta el análisis
Lenguaje Unificado de Modelado (UML)
¿Qué usamos? El Modelo de Hechos Dimensionales Análisis de datos en tiempo finito, y multidimensional
Diagrama en Estrella Tipo de consulta más usada, por el tipo relacional.
Cubos de datos Conjunto formado por todas las tablas Dimensión y la tabla Hecho
Análisis de datos Tareas conceptuales: Técnicas: Objetivos: Clasificación Optimización Interpolación Modelación Predicción Técnicas: Árboles de decisión Reglas de asociación Ajustes (regresiones..) Algoritmos genéticos Redes neuronales Objetivos: Target marketing Segmentación Control Predicción ventas Descubrir imperfecciones
Técnicas de minería de datos Redes neuronales. Inspirado en la forma en que funciona el sistema nervioso de los animales. Regresión lineal. Utilizada para formar relaciones entre datos
Técnicas de minería de datos Modelos estadísticos. Expresión simbólica en forma de igualdad o ecuación para indicar los diferentes factores que modifican la variable de respuesta. Árboles de decisión. Creación de estructuras de lógicas de información.
Interpretación de los resultados obtenidos Tipo de despliegue: Simple. generar un reporte Complejo. implementar un proceso de MD para una empresa Despliegue. ¿Cómo se usaran los resultados obtenidos? ¿Quién necesita usarlos?’ ¿Con qué frecuencia se usaran? Aplicado por el área responsable.
Evaluación de Modelos Matriz de confusión Lift charts Curva ROC
Data mining con SAS® Enterprise MinerTM SAS® (statistical analysis system) Enterprise Miner simplifica el proceso de minería de datos para crear modelos predictivos y descriptivos de gran precisión basados en el análisis de grandes cantidades de datos provenientes de todas las áreas de la empresa.
Oracle Data Mining Oracle brinda la primera plataforma que unifica aplicaciones de gestión de performance, herramientas de Business Intelligence y de análisis y almacenamiento de datos. Las soluciones de BI de Oracle están dirigidas a los ejecutivos de tecnología y negocios de organizaciones que buscan optimizar e integrar los procesos de análisis y gestión.
Fuerzas de Porter
Modelo Propuesto
Casos de Empaques Especiales
Proceso de Venta
Proceso de Compra
Diagrama de Secuencia
Aquí analizamos cuantos atributos tenemos y de que tipo son:
Inversión Costo de RRHH 96200 Costos de Hardware 21085 Resumen Inversion ITEM Costo S/. Costo de RRHH 96200 Costos de Hardware 21085 Costo de Software 22920.3 Costo Logísticos 1100 Costos de Infraestructura 9125 Otros 4370 TOTAL 154800.3
Ahorro Anual
S/. 141,000.27 𝐵𝑒𝑛𝑒𝑓𝑖𝑐𝑖𝑜= Ahorro – Inversión Columna1 Columna2 Columna3 Columna4 Meses enero -154800.3 TIR febrero 30000 15% marzo abril mayo VAN S/. 141,000.27 junio julio agosto septiembre octubre noviembre diciembre 𝐵𝑒𝑛𝑒𝑓𝑖𝑐𝑖𝑜= Ahorro – Inversión = 216000 – 154800 = 61200.00
Conociendo las tendencias cambiantes del mercado, las organizaciones podrán realizar las acciones para aumentar la rentabilidad del negocio. Conclusiones La reducción de gastos logísticos como la merma y el costo de transporte significará una madures en la sostenibilidad de la empresa en el mercado laboral.
GRACIAS