Motivación Data Mining

Slides:



Advertisements
Presentaciones similares
DATA MINING Bibliografía:
Advertisements

Introducción arquitectura base de datos Microsoft SQL Server 2000/2005
On Line Analytical Processing
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
INTELIGENCIA DE NEGOCIOS
Implementación de Datawarehouse
Business Intelligence y Data Mining
EVOLUCION DE SISTEMAS DE SOPORTE DE DECISIÓN. La evolución  1960: creación de aplicaciones individuales- Fortran, COBOL – Tarjetas perforadas.  Cintas.
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
“Diseño de un Data Mart para la Unidad de Programación y Abastecimiento de Hidrocarburos de Petrocomercial, Filial de Petroecuador”. Clientes deslumbrados.
1 Prof:Paula Quitral INTRODUCCIÓN DATAWAREHOUSE Departamento de Informática Universidad de Rancagua.
Especialista en Business Intelligence (Sesión 1) Microsoft SQL Server 2008 R2 (Nov.2013) Suscribase a o escríbanos a
Diseño de un data warehouse
KDD y Técnicas de Minería de Datos en Weka
Johandra Gastier David De Freitas
INTELIGENCIA DE NEGOCIOS Agosto Procesamiento de una gran masa de datos Analisis Avanzado Analisis de las decisiones coorporativas BUSINESS INTELLIGENCE.

Ing. Ernesto Sierraalta Fundamentos de Desarrollo de Proyectos de Inteligencia de Negocios ( Decision Support Systems & Data Warehousing.
Copyright © 2010 SAS Institute Inc. All rights reserved. Gustavo Gutman Gerente General Cono Sur Hotel Hilton Buenos Aires 17 de Noviembre 2011.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
ADMINISTRACIÓN Y GESTIÓN DE LA PRODUCCIÓN DE BIENES Y SERVICIOS
1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
Datawarehouse Ing. Adan Jaimes Jaimes Datawarehouse 1.
MAESTRIA EN ADMINISTRACION NEGOCIOS ELECTRONICOS MC. OMAR AGUSTIN HERNANDEZ G.
Gestión Empresarial - ERP ERP Back Office Compras Ventas (Facturación) Inventarios (Stock / Costos) Financiero (CxC, CxP, Bancos) Contabilidad de Gestión.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Escala de Medición. Profesor: Bachiller: Ramón Aray Parababire Claribel C.I.: Barcelona, Agosto del 2017 Instituto Universitario Politécnico.
Licenciatura en Contaduría Tema: 1.2 Punto de equilibrio.
Data Warehouse - OLAP.
Administración de Operaciones Estrategia
LECTURA Y ANÁLISIS BÁSICO DE ESTADOS FINANCIEROS
RENTABILIDAD EN LA CONTRATACION DE SERVICIOS TIPO OUTSOURCING
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE HIDALGO
Business Intelligence en la Industria de Retailing: Pronóstico de Ventas con Redes Neuronales y su Uso en la Reposición de Inventarios de un Supermercado.
Rediseño de Procesos Sistemas de Información Administrativos
09 de mayo del 2016Pg. 1 ING. BERTHA MAZON, UNIDAD III: SOLUCIONES DE INTELIGENCIA DE NEGOCIOS.
Ingeniería del Software III Gabriel Buades Mayo 1.999
Inteligencia de Negocios Business Intelligence (BI)
INTRODUCCIÓN AL ESTUDIO DE LA ESTADÍSTICA
Customer Relationship Management
Modelos y Herramientas de Gestión De Calidad de Servicios
Usos y aplicaciones de las BD
GXplorer 2025 Ing. Carla Demarchi Genexus Consulting
SISTEMAS DE INFORMACION
EDI ELECTRONIC DATA INTERCHANGE INTERCAMBIO ELECTRONICO DE DATOS MAURICIO AGUIRRE GIRALDO DANIEL RICARDO CORREA SARA.
M. En C. Pedro Alejandro Calvo Guerrero. Objetivo del proyecto Business Intteligence “La información en las organizaciones está aumentando rápidamente,
CI2355 – Almacenes de datos y OLAP
PROVEEDOR DATA WAREHOUSE TERADATA
CI2355 – Almacenes de datos y OLAP
Inteligencia de Negocios Business Intelligence (BI) Una herramienta para tomar decisiones.
“Análisis y Planeación Financiera”
NEGOCIOS ELECTRONICOS. INTRODUCCION Los negocios electrónicos, también conocidos como "e-business", pueden definirse como la utilización de tecnologías.
Estrategias de Negocio y Sistemas de Información
Página 1 Estadística I ESCALAS DE MEDICION. Página 2 Estadística I Existen cuatro escalas de medición: Escala de medida categórica: 1.Nominal 2.Ordinal.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
UNIDAD III SISTEMA DE COSTEO DIRECTO O VARIABLE Prof. María Estella Quintero de C.
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
INTRODUCCIÓN A LA MACROECONOMÍA
Recursos en español en la Biblioteca de la Universidad Kean
Introducción a la Estadística Informática 2016 – 1
La ciberseguridad en el sector bancario nacional
Unidad 1. Introducción a las Bases de Datos FUNDAMENTOS DE BASE DE DATOS.
 Es básicamente un proceso automático en el que se combinan descubrimiento y análisis.  El proceso consiste en extraer patrones en forma de reglas o.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
DATA WAREHOUSE Joseba Gil Noelia Suaña. ÍNDICE 1. Introducción. 2. ¿Qué es Data Warehouse? 3. Arquitectura. 4. Ventajas/Inconvenientes.
INTELIGENCIA DE NEGOCIOS Business Intelligence. Inteligencia de Negocios Algo peor que no tener información disponible es tener mucha información Y no.
1 DATA MINING Arantza Garcia Arrastia Curso 2004/2005.
DIRECCIÓN DE LA PRODUCCIÓN Transparencias
UNIDAD III SISTEMA DE COSTEO DIRECTO O VARIABLE Prof. María Estella Quintero de C.
Transcripción de la presentación:

Motivación Data Mining IN643 – Introducción a la Minería de Datos Otoño 2010 Motivación Data Mining Universidad de Chile Departamento de Ingeniería Industrial Profesor: Richard Weber (rweber@dii.uchile.cl) Prof. Auxiliar: Gastón L’Huillier (glhuilli@dcc.uchile.cl)

Data Warehouse – Definición Abbreviated DW, a collection of data designed to support management decision making. Data warehouses contain a wide variety of data that present a coherent picture of business conditions at a single point in time. Development of a data warehouse includes development of systems to extract data from operating systems plus installation of a warehouse database systems that provides managers flexible access to the data. The term data warehousing generally refers to the combination of many different databases across an entire enterprise. Contrast with data mart. Fuente: http://www.webopedia.com/TERM/D/data_warehouse.html

Arquitectura de un Data Warehouse Datos Información Decisión Fuente: Anahory, Murray (1997): Data Warehousing in the Real World. Herramientas de Data Mining Datos operacionales Información detallada Resumen Meta Datos Herramientas de OLAP Datos externos

Star Scheme - Esquema de estrella Tiempo Productos Transacciones de venta Ubicación Precio Fact table - Tabla de hechos Dimension tables - Tablas de dimensión

Diferencias entre Bases de Datos y Data Warehouses Características Bases de Datos Data Warehouses Volumen alto bajo o medio Tiempo de muy rápido normal respuesta Frecuencia de alta, baja actualizaciones permanentemente Nivel de los datos en detalle agregado IN643 – Introducción a la Minería de Datos - Otoño 2010

OLAP - Online Analytical Processing Producto Tiempo Ubicación

Navegación en un cubo OLAP Drill down: profundizar una dimensión Producto P1 Tiempo U1 Ubicación

Motivaciones para Almacenar Datos Razones iniciales: En telecomunicación: Facturación de llamadas Potenciales: En telecomunicación: Detección de fraude En supermercados: Gestión del inventario En supermercados: Asociación de ventas En bancos: Manejo de cuentas En bancos: Segmentación de clientes En empresas de producción: Control de procesos En empresas de producción: Mantenimiento preventivo IN643 – Introducción a la Minería de Datos - Otoño 2010

Idea básica y potenciales de data mining Empresas y Organizaciones tienen gran cantidad de datos almacenados. Los datos disponibles contienen información importante. La información está escondida en los datos. Data mining puede encontrar información nueva y potencialmente útil en los datos IN643 – Introducción a la Minería de Datos - Otoño 2010

Costos para guardar datos Costos de un disco duro (US-$) / Capacidad (MB) Fuente: http://www.sims.berkeley.edu/research/projects/how-much-info-2003/ IN643 – Introducción a la Minería de Datos - Otoño 2010

Disponibilidad de datos Capacidad de nuevos discos duros (PB) Fuente: http://www.sims.berkeley.edu/research/projects/how-much-info-2003/ IN643 – Introducción a la Minería de Datos - Otoño 2010

Proceso de KDD Knowledge Discovery in Databases Transformación Datos Datos se- leccionados Preprocesamiento Datos pre- procesados Datos transformados Data Mining Patrones Interpretación y Evaluación Selección “KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos“ IN643 – Introducción a la Minería de Datos - Otoño 2010

Potenciales de Data Mining - 1 IN643 – Introducción a la Minería de Datos - Otoño 2010

Potenciales de Data Mining - 2 IN643 – Introducción a la Minería de Datos - Otoño 2010

Aplicaciones de Data Mining Customer Relationship Management Segmentación de clientes Database Marketing Predicción de compra Retención de clientes Predicción de fuga Detección de Fraude Tarjetas de crédito Uso de teléfonos (celulares) Predicción de series de tiempo IN643 – Introducción a la Minería de Datos - Otoño 2010

Detección de Fraude Credicard Brazil, S.A.: Sistema para detección de fraude usando redes neuronales Reducción de fraude por 40% en un año Observación de transacciones de 4.5 millones de tarjetas de Credicard en tiempo real. IN643 – Introducción a la Minería de Datos - Otoño 2010

Detección de Fraude - ejemplos CTC Telefónica Chile ISAPRES Pago de Impuestos Importaciones en Aduanas (Caso de Aduanas del Perú) IN643 – Introducción a la Minería de Datos - Otoño 2010

Nivel de datos Nivel Significado Ejemplo Operación permitida Escala nominal “Nombre” de objetos número de telef. comparación Escala ordinal “Orden” de objetos Notas (1, …, 7) Transformación (sin distancia) monótona Escala de Punto cero y unidad Temp. en grados f(x)=ax + b intervalo arbitrario Cel. (a>0) Escala de Dado el punto cero Peso en kg f(x)=ax proporción Unidad arbitraria Ingreso en $ Escala Dado el punto cero Contar objetos f(x)=x absoluta y la unidad número de autos IN643 – Introducción a la Minería de Datos - Otoño 2010