La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Data Mining Integrantes:Rojas Correa, Trinidad Romanskyy, Bohdan Vargas Lopez, Sayda Visona, Alejandro.

Presentaciones similares


Presentación del tema: "Data Mining Integrantes:Rojas Correa, Trinidad Romanskyy, Bohdan Vargas Lopez, Sayda Visona, Alejandro."— Transcripción de la presentación:

1 Data Mining Integrantes:Rojas Correa, Trinidad Romanskyy, Bohdan Vargas Lopez, Sayda Visona, Alejandro

2 Datawarehouse ¿Qué es un Datawarehouse? Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas específicos de negocios, para permitir nuevas consultas, análisis y decisiones.

3 Datawarehouse: Objetivos Hace que la información de la organización sea accesible. Hacer que la información de la organización sea consistente. Es información adaptable y elástica. Es un seguro fuerte que protege los valores de la información. Es la fundación de la toma de decisiones.

4 Construcción de un Data Warehouse Adquisición: Adquisición: recopilar información de varias fuentas y unificarlas. Extracción Transformación Carga Almacenamiento: Almacenamiento: basado en un SGBD. El historial influirá en la estructura física. Acceso: Acceso: distintos grupos de usuarios requerirán distintas consultas.

5

6 ¿Que es Mineria de datos? ¿Que es Mineria de datos? DATA MINING Extraccion Extraccion no trivial de información que reside de manera implícita en los datos. prepara, sondea y explora los datos En otras palabras, el Data Mining prepara, sondea y explora los datos para sacar la información oculta en ellos.

7 Data Mining: Objetivos OBJETIVOS: Descripcion: Descubrimiento de reglas. Algoritmos no supervisados Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos Prediccion: estimar algunas variables de salida. Algoritmos supervisados Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos.ARQUITECTURA: Predicción automatizada de tendencias y comportamientos Descubrimiento automatizado de modelos previamente desconocidos Esto permite generar modelos predictivos según cada necesidad y reducir costos

8 Creación de un proyecto Data Mining Fases generales: Fases generales: En esta parte se emplean cuatro fases independientemente de la técnica específica de extracción de conocimiento usada. Filtrado de datos. Filtrado de datos. Selección de Variables. Selección de Variables. Extracción de Conocimiento. Extracción de Conocimiento. Interpretación y Evaluacion Interpretación y Evaluacion.

9 DM: Métodos y Técnicas Existen dos tipos de planteamientos: uno más interactivo que otro, para la extracción de información, y relacionan las estas fases SEMMA (SAS): S. Samplig: Muestreo. E. Exploration: Exploración de las Bases de datos. M.Modification: Modificación o transformación de variables para crear (en su caso) variables más aptas para los análisis. M. Modelling: Modelado estadístico. A. Assessment: Evaluación del DM, medido en coeficiente %

10 DM: Métodos y Técnicas CRISP-DM (SPSS): Comprensión del negocio. Compresión de los datos. Preparación de los datos. Modelado. Evaluación. Lanzamiento. La minería de datos trata el conocimiento inductivo.

11 DM: Métodos y Técnicas Las técnicas más representativas son: Redes neuronales: Redes neuronales: Los Mapas Autoorganizados, también conocidos como redes de Kohonen Árboles de decisión Árboles de decisión : Algoritmo C4.5 Modelos estadísticos. Agrupamiento o Clustering Agrupamiento o Clustering : Algoritmo K-means Visualización de datos.

12 DM: Utilidad Empresas que ofrecen productos y/o servicios (supermercados, empresas de telecomunicaciones, bancos), organismos gubernamentales. Contribuye significativamente en las aplicaciones de administración empresarial basada en la relación con el cliente, viendo rápidamente el retorno de la inversión.

13 DM: Utilidad La minería de datos podrá ser útil siempre que los sistemas sean parcialmente desconocidos, contengan una enorme cantidad de datos, y posean un potente hardware y software. Ejemplo de Casos: detección de hábitos de compra en supermercados, Patrones de fuga, fraudes y análisis de riesgos crediticios, terrorismo.


Descargar ppt "Data Mining Integrantes:Rojas Correa, Trinidad Romanskyy, Bohdan Vargas Lopez, Sayda Visona, Alejandro."

Presentaciones similares


Anuncios Google