Maestría en Explotación de Datos y Descubrimiento del Conocimiento

Slides:



Advertisements
Presentaciones similares
Solución de Problemas en AI
Advertisements

Inteligencia artificial y sus aplicaciones
Introducción a la minería de datos
Gramáticas, lenguajes y reconocedores
Gramáticas Libres de Contexto
DATA MINING MINERIA DE DATOS Gersom Costas.
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano.
GESTION DE DISPOSITIVOS
UCR – ECCI CI-2414 Recuperación de Información
Herramientas para la Investigación
La web semántica y su impacto en la recuperación de información
¿Cómo hacer para que una máquina comprenda el LN?
Pruebas Orientadas a Objeto
ATTOS Análisis de Tendencias y Temáticas a través de Opiniones y Sentimientos Kick-off 18 de julio de 2013.
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Definición Machine learning traducido al español significa el aprendizaje automático o también aprendizaje de las maquinas. A partir de esto podemos darle.
UNIVERSIDAD LATINA (UNILA) II.- ANALISIS DE ALGORITMOS
Objetivo: Conocer los componentes hardware y software que constituyen un computador.
Imagenes hiperespectrales: introducción
RECONOCIMIENTO DE OBJETOS
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
SISTEMAS DE INFORMACIÓN GEOGRÁFICA
ESTADISTICA PARA RELACIONES LABORALES
I Taller sobre Desarrollo de Software Dirigido por Modelos, MDA y Aplicaciones (DSDM'04) MDA Aplicado: Una Gramática de Grafos para la Transformación de.
CRITERIOS DE DECISIÓN BAJO INCERTIDUMBRE APLICADOS A ÁRBOLES DE DECISIÓN Ricardo Esteban Lizaso.
Sistemas Evolutivos Introduccion.
INTELIGENCIA DE NEGOCIOS
FUNDAMENTOS DE DATA MINING Y SUS APLICACIONES N. QUEIPO, S. PINTOS COPYRIGHT 2000 CLASIFICACIÓN NO SUPERVISADA.
RECONOCIMIETO DE PATRONES
PROGRAMACIÓN PARALELA Tema 4: Metodología de la programación
Lo bucadores son sistemas que permite al usuario buscar información,estos la consiguen de la web, pero otroa tanto la obtienen del news,gopher,ftp,etc.
Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Arquitectura de la Información Prof. Adelaide Bianchini – Dpto. de Computación y Tecnología de la Información, Universidad Simón Bolívar. Febrero 2006.
Especificación de Consultas M
Seminario de Análisis Documental  Presenta: Lilian Martínez Carrillo  Profesor: Georgina Araceli Torres México, D.F., 2011 Ley de Zipf y sus aplicaciones.

Isabel Edo del Moral Susana Fernández LLoria Patricia Moraga Barrero
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
HABILIDAD COGNITIVA CLASIFICAR.
Elaborado por: Aldo López Garrido Aránzazu Andrade Lara David González Quiroz.
Resoluciones de la imagen de satélite
Comunicación y Multimedia
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Menú Presentación Dispositivos de salida Que es informática SOFWARE Y
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL SIMÓN RODRÍGUEZ COORDINACIÓN DE DESARROLLO PROFESORAL NÚCLEO BOLÍVAR FACILITADOR:
EL CONOCIMIENTO DEL MEDIO EN LA EDUCACIÓN PRIMARIA.
Alfonso Varela Toro José Ramón Polo López MODELADO DE LA MAQUINARIA CELULAR A TRAVÉS DE LA COMPARACIÓN DE REDES BIOLÓGICAS.
Una introducción a la computación evolutiva
Parte I. Estructuras de Datos.

Tesauros y descriptores en Ciencias de la Salud MeSH/DeCS
Conceptos Básicos de Informática
SISTEMA PARA LA CATEGORIZACIÓN AUTOMÁTICA DE CORREO ELECTRÓNICO Camilo Rodríguez, Departamento de Ingeniería de Sistemas, Universidad Nacional de Colombia.
Web Semántica La Web Semántica es la nueva generación de la Web, que intenta realizar un filtrado automático preciso de la información. Para ello, es necesario.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) TRADUCTORES Y ANALIZADOR LEXICOGRÁFICO.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
Introducción a los Sistemas Inteligentes
G R U P O I B E R M Á T I C A Analítica Avanzada & Linked Data.
EL espacio geográfico Observa con atención las siguientes imágenes y define los componentes naturales, sociales y económicos que los caracterizan.
Minería de texto Análisis Documental.
Estrategias efectivas para buscar y encontrar información Dr. Valentino Morales López Investigador INFOTEC Centro de Investigación.
INGENIERIA EN SISTEMAS COMPUTASIONALES. SISTEMAS EXPERTOS Es una aplicación informática capaz de solucionar un conjunto de problemas que exigen un gran.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Minería de Datos MC BEATRIZ BELTRÁN MARTÍNEZ FACULTAD DE CIENCIAS DE LA COMPUTACIÓN. Primavera 2016.

La diversidad de la vida y su clasificación
Por definición, existe una sola enfermedad, pero la caracterización e identificación de variados procesos y estados diferentes de la salud, ha llevado.
1.ª Parte: Dónde y cómo buscar información.  Cuando se busca información sobre un tema, es necesario emplear una «estrategia de búsqueda» para optimizar.
Gestión de la información y el conocimiento II Bibliometría Ángela Valderrama Muñoz Ingeniera de Sistemas (UdeA) Especialista en Alta Gerencia(UdeA) Magister.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Transcripción de la presentación:

Maestría en Explotación de Datos y Descubrimiento del Conocimiento Aplicaciones en Ciencia y Tecnología

Aplicaciones Textos Ontologías Datos espaciales y temporales Imágenes Grafos Redes Sociales Biología Series de Tiempo Streams

Aplicaciones Minería de Texto Clasificar o categorizar documentos Análisis de encuestas Procesamiento automático de mensajes Construcción de Ontologías Buscadores (Vivisimo) Datos espaciales Patrones de evolución de Enfermedades Clasificación en astronomía Grafos Patrones en estructuras moleculares Patrones de uso en la web Redes sociales Biología Expresiones de genes Alineamiento de secuencias

Tratamiento genérico Datos no estructurados o estructuras complejas Procesamiento previo y extracción de características Estructuras adecuadas a algoritmos adaptados o específicos Ejecución de los algoritmos Vector de pesos Sacar palabras muy comunes, Stemming (raíz de la palabra) Clasificación de documentos Texto Imágenes Grafos Datos Espaciales Genéticos Encontrar formas comunes Dividir en formas simples R-Tree

Cuándo aplicar minería en C&T No existen métodos analíticos o estos son extremadamente complejos Es muy costoso cubrir todos los casos o pueden ser datos técnicamente disponibles pero no en la práctica El mundo está lleno de correlaciones accidentales; el resultado de una búsqueda puede ser un reflejo de lo que queremos encontrar y no del fenómeno real.

Cuándo aplicar minería en C&T Exploración petrolera Solución de un número creciente de problemas en la industria petrolera, en áreas tales como: caracterización de yacimientos, optimización integrada subsuelo-superficie, detección temprana de mermas de producción, y monitoreo y control de operación de pozos. Astronomía Sloan Digital Sky Survey, SDSS: imágenes en el espectro visible. Más de un millón de objetos clasificados. 15,7 TB de imágenes, 26,8 TB de otros datos. Comportamientos de Epidemias Capacidades para la detección de la enfermedad, el seguimiento, y la situación de Salud. (Datos Espacio/Temporales, grafos)

Cuándo aplicar minería en C&T Microarreglos

Minería de Textos Análisis de información no estructurada en forma de texto Usa técnicas de Recuperación de la Información, extracción de la Información y procesamiento de lenguaje natural Es necesario un preprocesamiento de la información Crear un diccionario con todas las palabras ocurridas en los documentos Remover las palabras “stops”, “stemming” (variantes de la misma palabra raíz pueden ser consideradas equivalentes) Convertir a un vector de frecuencias de palabras: nuestro espacio de búsqueda es un espacio vectorial de palabras desde un vocabulario controlado. Aplicaciones: Categorización y clasificación de documentos

Minería de Textos Se debe “pesar” la palabra en el contexto de la colección de documentos: cuanto más aparece, menos valor discriminante tiene. Reducir la dimensión del espacio de vectores en un espacio de conceptos que agrupen palabras con igual significado: Latent Semantic Indexing. Categorización de documentos, consiste en asignar a cada documento una o varias categorías temáticas de entre un conjunto de categorías preestablecido. Agrupamiento de documentos consiste en la generación automática de grupos de documentos relacionados, por ejemplo, documentos que traten un mismo tema o asunto. A diferencia de lo que ocurre en la categorización, en los procesos de agrupamiento no existe un conjunto de categorías preestablecido, sino que el propio algoritmo a utilizar debe generar automáticamente esas categorías, contribuyendo de esta forma a generar un nuevo conocimiento.

Minería de Textos Concepto A Concepto B

Minería de Datos Espaciales Representar el objeto por el rectángulo más pequeño [(x1,y1), (x2,y2)] (MBR) y de manera recursiva (x2,y2) (x1,y1)

R-Tree: Los MBR forman un árbol de orden m (en este caso 3) Minería de Datos Espaciales R-Tree: Los MBR forman un árbol de orden m (en este caso 3) R8 R8 R1 R2 R3 R6 R5 R4 R7 R6 R7 R1 R2 R3 R4 R5 Se puede usar la infromación espacial a niveles diferentes de granularidad

Minería de Datos Espaciales

Minería de Grafos Redes sociales, interacciones de proteínas, análisis de estructuras en compuestos químicos, redes de computadoras. Encontrar subgrafos comunes Encontrar subgrafos inusuales

Series de Tiempo

Series de Tiempo