Slides:



Advertisements
Presentaciones similares
¿ Que es una muestra?.
Advertisements

Unidad I. Conceptos Básicos y Estadística Descriptiva
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Jacqueline Chávez Cuzcano
Introducción a la minería de datos
DATA MINING MINERIA DE DATOS Gersom Costas.
Investigación de Operaciones
La web semántica y su impacto en la recuperación de información
¿Cómo hacer para que una máquina comprenda el LN?
METODO DE ANALISIS DE FALLAS
El proceso de extracción de conocimiento
DATA MINING Bibliografía:
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
Programación 1 Introducción
VIVIANA ACHURY S. ANGIE NATALIA GARCIA S.. En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos (Bajo.
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
Técnicas de Capacitación
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
INTELIGENCIA DE NEGOCIOS
VII Reunión sobre casos prácticos de inspección y vigilancia de mercados y entidades. Santiago de Chile Marcelo García R Sonia Muñoz C. Santiago, 17 de.
TRADUCTOR DE UN PROGRAMA
APRENDIZAJE BASADO EN PROBLEMAS

Weka.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A

Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.

Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
Business Intelligence y Data Mining
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
5.3 APROXIMACIONES AL DISEÑO
Tema 6. Conceptos básicos de programación (Repaso) Prof. María Alejandra Quintero Informática Año 2013.
Análisis y Diseño Orientado a Objetos utilizando UML
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
UNIDAD 2. ALGORITMOS Y ESTRUCTURAS DE DATOS.
La Información en las Organizaciones. Datos Externos Datos Internos Datos Personales Data Mining Data Warehouse Data Marts Meta Data OLAP Queries DSS.
Algo peor que no tener información disponible es tener mucha información y no saber qué hacer con ella. La Inteligencia de Negocios o Business Intelligence.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Universidad Central de Venezuela Facultad de Ciencias Postgrado en Ciencias de la Computación Sistemas Distribuidos Albany Márquez.
Minería de Dato(Datamining). Minería de Datos Datamining (Minería de datos)  El datamining (minería de datos), es el conjunto de técnicas y tecnologías.
ERICK CISNEROS SAAVEDRA GABRIELA REGULES GUTIÉRREZ Datamining.

TEMA 10: DIAGRAMA DE: OBJETOS, SECUENCIA Y DESPLIEGUE EN UML
Representación de Algoritmos
SENA REGIONAL HUILA REGIONAL HUILA CENTRO DE LA INDUSTRIA LA EMPRESA Y LOS SERVICIOS Huila Elementos de sistemas de información.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
(Validez de un estudio)
III. DESARROLLO DE SISTEMAS.. Podemos definir el desarrollo de sistemas informáticos como el proceso mediante el cual el conocimiento humano y el uso.
KDD y Técnicas de Minería de Datos en Weka
TIPOS DE PRUEBAS DEL SOFTWARE
Software.
Un conjunto de perfiles UML para el modelado conceptual de minería de datos sobre almacenes de datos Tesis Doctoral José Jacobo Zubcoff Vallejo 26 de Junio.
Herramientas básicas Control de Calidad.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
LOGO Profa. Oly Mata. Concepto de Datos: Un dato puede considerarse como un elemento no tratado; como una señal emitida. 25% es un dato Son los elementos.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.
Taller de investigación 1

Objetivos de la prueba Los objetivos principales de realizar una prueba son: Detectar un error. Tener un buen caso de prueba, es decir que tenga más probabilidad.
Algoritmo Genético para la solución del problema SAT René Clemente Juárez Angel Felipe Lara Valladares Junio 2012.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

MC Beatriz Beltrán Martínez Funcionalidad Predictiva: En base a una clasificación: por ejemplo si el cliente pagará o no pagará, o el tipo de dolencia que puede tener un paciente. En base a una regresión: por ejemplo calcular el tiempo previsible que se empleará en corregir los errores de un desarrollo de software. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Funcionalidad Descriptiva: Agrupamiento (clustering): clasificar individuos en grupos en base a sus características. Por ejemplo, clasificar pacientes del hospital. Reglas de asociación: conocer cómo se relacionan los datos o campos. Por ejemplo conocer en el hipermercado que un cliente que compra leche muy probablemente comprará también pan. Secuenciación: intentar predecir el valor de una variable en función del tiempo. Por ejemplo la demanda de energía eléctrica. Primavera 2016 MC Beatriz Beltrán Martínez

Relación con otras disciplinas Las bases de datos. Uso de almacenes de datos y/o OLAP (On-Line Analytical Processing). OLAP Este tipo de procesamiento en tiempo real maneja operaciones únicamente de consulta sobre grandes cantidades de información con la finalidad de realizar informes y resúmenes → toma de decisiones. La recuperación de información. Obtener información desde datos textuales. Primavera 2016 MC Beatriz Beltrán Martínez

Relación con otras disciplinas La estadística. Son necesarios cálculos para obtener: la media, la varianza, las distribuciones, el análisis univariante y multivariante, la regresión lineal y no lineal, la teoría del muestreo, la validación cruzada, la modelación paramétrica y no paramétrica, técnicas bayesianas. El aprendizaje automático. La máquina usa algunos ejemplos para aprender un modelo y los utiliza para resolver el problema. Primavera 2016 MC Beatriz Beltrán Martínez

Relación con otras disciplinas Los sistemas para la toma de decisión. El análisis ROC (Receiver Operating Characteristic) y los árboles de decisión. La visualización de datos. Uso de diagramas de barras, graficas de dispersión, histogramas, coloreado de imágenes. La computación paralela y distribuida. Distribuir las tareas más complejas entre diferentes procesadores o nodos. Primavera 2016 MC Beatriz Beltrán Martínez

Relación con otras disciplinas Procesamiento del lenguaje natural. Es una disciplina encargada de producir sistemas informáticos que ayuden en la comunicación, por medio de la voz o del texto. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez El proceso de KDD MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez KDD El KDD (Knowledge Discovery from Databases) es el proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y en última instancia, comprensibles a partir de los datos. (Fayyad) El objetivo fundamental del KDD (Knowledge Discovery from Databases), es encontrar conocimiento útil, válido, relevante y nuevo sobre una determinada actividad mediante algoritmos, dadas las crecientes órdenes de magnitud en los datos Primavera 2016 MC Beatriz Beltrán Martínez

Etapas de KDD Interpretación/Evaluación Minería de Datos Transformación Preprocesamiento Selección Conocimiento Patrones Datos Datos procesados Datos transformados Datos objetivos Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Selección de datos. Consiste en buscar el objetivo y las herramientas del proceso de minería, identificando los datos que han ser extraídos, buscando los atributos apropiados de entrada y la información de salida para representar la tarea. Esto quiere decir, primero se debe tener en cuenta lo que se saber lo que se quiere obtener y cuáles son los datos que nos facilitarán esa información para poder llegar a nuestra meta, antes de comenzar el proceso en tal. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Limpieza de datos. En este paso se limpian los datos sucios, incluyendo los datos incompletos (donde hay atributos o valores de atributos perdidos), el ruido (valores incorrectos o inesperados) y datos inconsistentes (conteniendo valores y atributos con nombres diferentes). Los datos sucios en algunos casos deben ser eliminados ya que pueden contribuir a un análisis inexacto y resultados incorrectos. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Integración de datos. Combina datos de múltiples procedencias incluyendo múltiples bases de datos, que podrían tener diferentes contenidos y formatos. Transformación de datos. Consisten en modificaciones sintácticas llevadas a cabo sobre datos sin que supongan un cambio para la técnica de minería aplicada. Las transformaciones discretas de los datos tienen la ventaja de que mejoran la comprensión de las reglas descubiertas al transformar los datos de bajo nivel en datos de alto y también reduce el tiempo de ejecución del algoritmo de búsqueda. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Su principal desventaja es que se puede reducir la exactitud del conocimiento descubierto, debido a que puede causar la perdida de alguna información. Reducción de datos. Reducir el tamaño de los datos, encontrando las características Más significativas dependiendo del objetivo del proceso. Se pueden utilizar métodos de transformación para reducir el número efectivo de variables a ser consideradas, o para encontrar otras representaciones de los datos. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD reducción de dimensiones (la extracción irrelevante y débil de atributo), compresión de datos (reemplazando valores de datos con datos alternativos codificados), reducción de tamaño (reemplazando valores de datos con representación alternativa más pequeña), una generalización de datos (reemplazando valores de datos de niveles conceptuales bajos con niveles conceptuales más altos), etc. Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Minería de Datos. Consiste en la búsqueda de los patrones de interés que pueden Expresarse como un modelo o simplemente que expresen dependencia de los datos. Se tiene que especificar un criterio de preferencia para seleccionar un modelo de un conjunto de posibles modelos. También se tiene que especificar la estrategia de búsqueda a utilizar (normalmente está determinado en el algoritmo de minería). Primavera 2016 MC Beatriz Beltrán Martínez

MC Beatriz Beltrán Martínez Etapas de KDD Evaluación de los patrones. Se identifican verdaderamente patrones interesantes que representan conocimiento usando diferentes técnicas incluyendo análisis estadísticos y lenguajes de consultas. Interpretación de resultados. Consiste en entender los resultados del análisis y sus implicaciones y puede llevar a regresar a algunos de los pasos anteriores Primavera 2016 MC Beatriz Beltrán Martínez