Introducción a la minería de datos

Slides:



Advertisements
Presentaciones similares
¿PARA QUE ESTAMOS AQUÍ? LOS OBJETIVOS DE LA ENCARNACIÓN.
Advertisements

SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
Segmentación, Definición de Público Objetivo y Posicionamiento
ESTRUCTURA DE CAPITAL Y RIESGO DEL NEGOCIO
Paso 1 Portada YO SOY EUROPEO Comisión Europea.
Jacqueline Chávez Cuzcano
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO Resumen. 24 de Junio de 2005.
Aranda Fernández, Miguel Ángel García Redondo, Luis Miguel
Introducción Programación Matemática Objetivos:
Relaciones y diferencias entre minería de datos y estadística
Análisis de asociación
Árboles de decisión Tema 9 Parte teórica Minería de datos
Razonamiento basado en memoria
Metodología de la Investigación Social
TALLER DE COMPETENCIAS VITRO
DATA MINING MINERIA DE DATOS Gersom Costas.
¿Qué es la estadística? Capítulo uno OBJETIVOS UNO
Introducción a La Estadística
Comportamiento del Consumidor
1 Conversatorio con Consumidores que compran en Supermercados de la ciudad de Barranquilla Análisis Estadístico Desarrollado por: Andrés Muñoz 2006.
Marketing Relacional Estrategias
GRÁFICOS SOBRE DATOS GENERALES. Inicio de la causa 1 - Datos generales.
03 Estudio del mercado El estudio del mercado trata de averiguar la respuesta del mercado ante un producto o servicio, con el fin de plantear la estrategia.
Sistemas de Ecuaciones
Macroeconomía.
Introducción a los Números Fraccionarios
K-NN: K vecinos más cercanos
Proyecto para Centros que trabajan una vez por semana.
SEMINARIOS EMPRESARIALES II SESIÓN.
Capítulo: 9 Inventarios.
La minimización de los costes
Investigación Algorítmica
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
Comité Nacional de Información Bogotá, Julio 21 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Comité Nacional de Información Bogotá, Julio 27 de 2011 Consejo Nacional de Operación de Gas Natural 1 ESTADISTICAS NACIONALES DE OFERTA Y DEMANDA DE GAS.
Máquinas con Vectores de Soporte - SVM
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
CULENDARIO 2007 Para los Patanes.
Números enteros.
Taller: Inteligencia Computacional
MACROECONOMIA.
Sistemas Basados en conocimientos
Investigación en acción
Objetivo. Dado que ya tenemos la planificación temporal del proyecto, que responde a: ¿Qué se hará?, ¿Quién lo hará?, y ¿Cuándo lo hará? ¿Qué recursos.
ESTADOS FINANCIEROS A DICIEMBRE DE 2013.
El Precio.
POLÍTICA DE PRECIOS.
Agrupamiento de relaciones no lineales entre expresiones de genes
ESTRUCTURA DE CAPITAL.
Clase 1. 4 Copyright Juan Collia Salvador 1 1o Paso: Conocer el producto Es decir, lo que es el producto y lo que hace. Lo importante es saber para que.
Recursos humanos y responsabilidad social corporativa
Estadística Administrativa II
INTELIGENCIA DE NEGOCIOS
Estadística Administrativa I
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Business Intelligence y Data Mining
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
De los clientes potenciales, debe tenerse en cuenta que es posible que sean personas naturales que actúen como consumidores finales, así como pueden ser.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
KDD y Técnicas de Minería de Datos en Weka
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.

Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
Transcripción de la presentación:

Introducción a la minería de datos Tema 1 Minería de datos Dr. Francisco J. Mata

Temario ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Por qué de la minería de datos? Ciclo virtuoso de la minería de datos Resumen de principales técnicas de minería de datos Minería de datos Dr. Francisco J. Mata

Definición de minería de datos Minería de datos es la exploración y análisis de grandes cantidades de datos con el objeto de encontrar patrones y reglas significativas (conocimiento) Minería de datos Dr. Francisco J. Mata

Metas de la minería de datos Permitir a una organización MEJORAR _____ a través de un mejor CONOCIMIENTO de _______ Mejorar la ventaja competitiva Minería de datos Dr. Francisco J. Mata

La minería de datos es un campo multidisciplinario Inteligencia Artificial (“Machine Learning”) Estadística Minería de datos Bases de Datos (VLDB) Ciencias de la información Graficación y visualización Otras disciplinas Minería de datos Dr. Francisco J. Mata

La minería de datos es un subconjunto de la inteligencia de negocios Dr. Francisco J. Mata

Minería de datos Proceso de utilizar datos “crudos” para inferir importantes relaciones entre ellos Colección de técnicas poderosas para analizar grandes volúmenes de datos No existe un solo enfoque para minería de datos sino un conjunto de técnicas que se pueden utilizar de manera independiente o en combinación Existe una relación con la estadística, aunque frecuentemente se separan las técnicas que no están basadas en métodos estadísticos Minería de datos Dr. Francisco J. Mata

Tipos de aplicaciones de la minería de datos Aplicaciones o problemas de minería de datos pueden clasificarse en las siguientes categorías Clasificación Estimación Pronóstico Asociación Agrupación o segmentación Minería de datos Dr. Francisco J. Mata

Clasificación Examinar las características de un nuevo objeto y asignarle una clase o categoría de acuerdo a un conjunto de tales objetos previamente definido Ejemplos: Clasificar aplicaciones a crédito como bajo, medio y alto riesgo Detectar reclamos fraudulentos de seguros Minería de datos Dr. Francisco J. Mata

Estimación Relacionado con clasificación Ejemplos: Mientras clasificación asigna un valor discreto, estimación produce un valor continuo Ejemplos: Estimar el precio de una vivienda Estimar el ingreso total de una familia Minería de datos Dr. Francisco J. Mata

Pronóstico Predecir un valor futuro con base a valores pasados Ejemplos: Predecir cuánto efectivo requerirá un cajero automático en un fin de semana Minería de datos Dr. Francisco J. Mata

Asociación Determinar cosas u objetos que van juntos Ejemplo: Determinar que productos se adquieren conjuntamente en un supermercado Minería de datos Dr. Francisco J. Mata

Agrupación o segmentación Dividir una población en un número de grupos más homogéneos No depende de clases pre-definidas a diferencia de clasificación Ejemplo: Dividir la base de clientes de acuerdo con los hábitos de consumo Minería de datos Dr. Francisco J. Mata

Usos de la minería de datos Administración de la relación con los clientes: Identificar nuevos clientes potenciales para aumentar ventas Ampliar la base de cliente con la mínima inversión por parte de la empresa Retener clientes existentes evitando que se vayan a la competencia (“attrition”) Vender más a clientes existentes (“ventas cruzadas”) Minería de datos Dr. Francisco J. Mata

Usos de la minería de datos Detección de fraudes en el uso de tarjetas de crédito Determinar patrones que puedan estar relacionados con lavado de dinero Determinar el precio de una casa con base en sus características y el precio de otras casas vendidas Minería de datos Dr. Francisco J. Mata

Ejercicio en grupos Equipos: 3 personas máximo Objetivos: Identificar situaciones concretas para utilizar la minería de datos (10 minutos) Reportar a la clase verbalmente (3 minutos) Las situaciones identificadas Tipo de aplicación o problema de minería de datos relacionado Los beneficios esperados de aplicar la minería de datos Minería de datos Dr. Francisco J. Mata

Usos de la minería de datos Usos de la minería de datos se han ampliado con el comercio electrónico Minería de datos Dr. Francisco J. Mata

Recomendaciones Minería de datos Dr. Francisco J. Mata

Disponibilidad de datos de transacciones Minería de datos Dr. Francisco J. Mata

¿Por qué de la minería de datos? Datos se encuentran disponibles Poder computacional es cada vez menos costoso Las presiones competitivas son enormes Software para minería de datos se encuentra disponible Minería de datos Dr. Francisco J. Mata

Ciclo virtuoso de la minería de datos Dr. Francisco J. Mata

Principales técnicas de minería de datos Análisis de canasta de supermercado K vecinos más cercanos Detección de grupos Análisis de encadenamiento Árboles de decisión Redes neuronales artificiales Algoritmos genéticos Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Análisis de canasta de supermercado Agrupar objetos que aparecen juntos Ejemplos: Pañales y cervezas Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos K vecinos más cercanos Determinar los K vecinos más cercanos en instancias conocidos con el objeto de clasificar o hacer una predicción sobre una instancia desconocida Ejemplo: Dado un reclamo para un seguro determinar basado en reclamos similares (vecinos) si se debe pagar o investigar Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Detección de grupos Encontrar objetos similares entre sí Ejemplos: tipificar clases de clientes Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Análisis de encadenamiento Encuentra relaciones entre objetos de acuerdo con patrones Relacionado con la teoría de grafos Ejemplos: Relaciones entre individuos basados en llamadas telefónicas Relaciones entre casos criminales de acuerdo con sus características Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Árboles de decisión Dividir objetos en grupos asociando reglas para la asignación de los objetos en su correspondiente grupo Ejemplos: determinar el sexo o grupo de edad de una persona en función a una serie de preguntas contestadas Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Redes neuronales artificiales Más común de las técnicas y para algunos sinónimo de minería de datos Modelos simples de interconexiones neuronales en el cerebro que aprenden de un conjunto de adiestramiento y generalizan patrones dentro de él con el objeto de clasificar, estimar o predecir Ejemplo: estimar el valor de una casa tomando en cuenta el precio pagado por casas similares Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Algoritmos genéticos Aplican la mecánica de la genética y la selección natural para encontrar un conjunto de parámetros óptimos para una función predictiva Utilizados para entrenar redes neuronales artificiales Minería de datos Dr. Francisco J. Mata

Resumen técnicas de minería de datos Técnicas mencionadas pueden utilizarse en varias aplicaciones o problemas de minería de datos Ejemplo: árboles de decisión sirven para detectar grupos, clasificar y predecir Varias técnicas pueden ser utilizadas en una misma aplicación o problema de minería de datos Ejemplo: K vecinos más próximos, árboles de decisión y redes neuronales artificiales pueden utilizarse para clasificación Minería de datos Dr. Francisco J. Mata