DATA MINING y el Posgrado en Explotación de datos y descubrimiento del conocimiento Ana S. Haedo Departamento de Computación F.C.E.y N. UBA Redbio Rosario.

Slides:



Advertisements
Presentaciones similares
DATA MINING. Extracción de información oculta y predecible de grandes bases de datos Poderosa tecnología que ayuda a concentrase en la información importante.
Advertisements

1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
Se entiende por métodos de investigación, aquellos procedimientos lógicos y rigurosos que siguen los investigadores para obtener conocimiento. Toda investigación.
Ing. Cruces Hernández Guerra. INVESTIGACION CIENTIFICA Reflexivo Sistemático Controlado Metódico y Crítico Reflexivo Sistemático Controlado Metódico y.
Lic.Walter Marcelo Vereau Director de la Unidad de Estudios de la Segunda Especialidad Universidad Nacional Pedro Ruíz Gallo-Lambayeque.
Curso de Aptitud Pedagógica 2006/2007 OpenOffice Base Introducción a las Bases de Datos.
MÁSTER MNTI: “ Tecnologías inteligentes y del conocimiento con aplicaciones en medicina”
Capítulo IV: Análisis e Interpretación de los Datos Codificación y Tabulación de los Datos Técnicas de Presentación de los Datos Análisis Estadísticos.
Presentación del curso
TUTORIA 1 Lógica para la Computación TUTORIA 1 Facultad de Ciencias Naturales y Matemáticas.
Informática Empresarial Docente – Carlos Andrés Bonil Mariño INFORMATICA EMPRESARIAL  CARLOS ANDRES BONIL MARIÑO  INGENIERO DE SISTEMAS.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
La Ingeniería de Sistemas
UNIVERSIDAD PEDAGÓGICA NACIONAL FRANCISCO MORAZÁN DEPARTAMENTO DE CIENCIAS DE LA EDUCACIÓN METODOLOGÍA DE INVESTIGACIÓN CUANTITATIVA “Ventajas y desventajas.
Cloud Computing Cloud Robotic
Ingreso , proceso y salida de datos
Bases de Datos (BD) Santiago Velilla Marco
Primera Versión Mgr. Omar Pérez.
Introducción a la Ingeniería Civil Informática
Universidad American College. Objetivos Introducción a la Informática Tema: Introducción a la Informática 1.Explicar los conceptos fundamentales relacionados.
Productos de VT e IE Análisis de tendencias Investigación de mercado
Informática Especial de la Matemática
Diplomado en Educación Superior
Análisis de resultados Evaluación diagnóstica en línea
AUTOR: RITA ALEXANDRA FIALLOS NOBOA
7ª Jornada sobre la Biblioteca Digital Universitaria JBDU2009 "La  biblioteca universitaria en la web" 5 y 6 de noviembre de 2009 Biblioteca Central de.
SIG para la Agricultura de Precisión
Hardware Software Sistema Informática Computadora Computación Datos.
PARTE I: INTRODUCCIÓN.
TIPOS DE INVESTIGACIÓN CIENTÍFICA El tipo de investigación, al elaborar un proyecto, se define preliminarmente desde la etapa de identificación y formulación.
UNIVERSIDAD ICEP INTELIGENCIA ARTIFICIAL INGENIERÍA EN SISTEMAS COMPUTACIONALES Martes, 24 de Octubre de 2017 REPRESENTACIÓN DEL CONOCIMIENTO Y RAZONAMIENTO.
DEFENSA DEL TRABAJO DE TITULACIÓN
LA INVESTIGACION CIENTIFICA
Universidad Nacional de Canindeyú Facultad de Ciencias de la Salud
EL SISTEMA DE INFORMACION GERENCIAL MIGUEL ANGEL TRESIERRA AYALA.
Propuesta Comercial dirigida a la
PROVEEDOR DATA WAREHOUSE TERADATA
Seminario de Titulación (4)
TITULO TESIS. Informe de investigación presentado a la Facultad de Ciencias de la Educación de la Universidad Central para optar al grado académico de.
TIPOS DE INVESTIGACIÓN I
PRESENTADO POR: Fernando Andrade Potes
Conceptos Relacionados Unidad I. Parte A.
UNIVERSIDAD NACIONAL DE ROSARIO
Conocimiento de la nueva moneda virtual Bitcoin entre los estudiantes de Ciencias Administrativas de la Universidad Interamericana de Panamá. Integrantes:
APLICACIÓN DE NUEVAS TECNOLOGÍAS EN LA CONSERVACIÓN Y ANÁLISIS DEL PATRIMONIO CULTURAL Herramientas para la Investigación.
Dariela Elizabeth Mata Dueñez LAE CP. Gerónimo Juárez Ibarra ‘’Investigación Científica’’
TITULO TESIS. Informe de investigación presentado a la Facultad de Ciencias de la Educación de la Universidad Central para optar al grado académico de.
Tecnologías de la Información y Comunicaciones
Desarrollo de Software (SIG) Estudiante: Alejandro Milan Villarroel Hidalgo.
Dr. Manuel F. Guillén Galarza. INVESTIGACION CIENTIFICA Reflexivo Sistemático Controlado Metódico y Crítico Reflexivo Sistemático Controlado Metódico.
INSTITUTO DE ESTUDIOS SUPERIORES DE CAMPECHE MAESTRIA EN: RECURSOS HUMANOS ASIGNATURA: DESARROLLO DE PROYECTOS DE INVESTIGACION CATEDRATICO: ING. EDGAR.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Política Turística II. PRESENTACIÓN
Facultad de Educación, Ciencia y Tecnología
La Investigación Científica
Tecnologías de la Información y Comunicaciones (AEQ-1064)
FUNDAMENTOS DE PROGRAMACIÓN. INTRODUCCIÓN  Conceptos: Informática, Ordenador, Programa, Dato, Bit, Byte, Hardware, Software, Lenguaje de Programación,
Introducción a la informática. Definiciones Es el término resultante de la contracción de los vocablos INFORmación y autoMÁTICA. Se define como el conjunto.
NUEVAS TECNOLOGIAS DE INFORMACION Y COMUNICACIÓN.
ORIENTACIÓN MEDICINA – ENFERMERÍA
Actividad 3: Ejecutar procesos de recolección de datos, organización y análisis de los datos recolectados para la identificación de la línea de base de.
INVESTIGACIÓN EDUCATIVA. PROCESO DE BÚSQUEDA SISTEMÁTICA DE ALGO NUEVO El conjunto de acciones sistemáticas y deliberadas que llevan a la formación, diseño.
 Es básicamente un proceso automático en el que se combinan descubrimiento y análisis.  El proceso consiste en extraer patrones en forma de reglas o.
* INVESTIGAR: INVESTIGAR: Proviene del Latín: in (en) vestigare (hallar, indagar, seguir vestigios La investigación es un proceso riguroso, cuidadoso.
La programación de objetivos didácticos en Terminótica
Taller de grado I INFORMACIÓN GENERAL
Docente: Mg.Henry Infante Takey Unidad 1 Investigación Operativa 1.
Ciencias III: énfasis en Química CAMPO FORMATIVO EXPLORACIÓN Y COMPRENSIÓN DEL MUNDO NATURAL Y SOCIAL.
PROFESOR RESPONSABLE: Dr. C. Juan Carlos MICHALUS
Transcripción de la presentación:

DATA MINING y el Posgrado en Explotación de datos y descubrimiento del conocimiento Ana S. Haedo Departamento de Computación F.C.E.y N. UBA Redbio Rosario Abril 2009

El análisis de datos se ha tornado dominante en el siglo 21. Es un Problema y una Solución

Problema: grandes volúmenes de datos Ventajas : La posibilidad de describir la realidad y formular teorías .

Hasta ahora se empleaba la metodología estadística para extraer información útil. Hoy Data Mining recurre al poder de la tecnología informática para analizar las gigantescas bases de datos que presentan los problemas multidisciplinarios Nos sumergimos en las datos buscando conocimiento pues el volumen de las bases excede los terabytes

Estadística Le da sentido a los datos Tiene problemas en el manejo de grandes volúmenes de datos

Hoy hay disponibilidad de tres tecnologías: Recolección masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.

NUEVAS HERRAMIENTAS Métodos Algorítmicos Métodos iterativos Clasificación Automática Selección Paso a Paso Máxima Verosimilitud Métodos Descriptivos Multidimensionales

Nuevos Dominios de Aplicación Análisis de Imágenes Análisis de Señales Análisis de Procesos Análisis de datos textuales

SITUACIÓN Más datos colectados Más datos almacenados Más datos accesibles Más datos distribuidos

HARDWARE Las bases deben almacenarse y ser fácilmente accesibles para su explotación. Eso requiere mucho espacio en disco y memoria RAM

Almacenamiento de grandes bases de datos Data Mining Es parte de un proceso conocido como "descubrimiento de conocimiento a partir de datos"(KDD:Knowledge Discovery in Databases).

¿Qué es Data Mining ? Proceso de extracción de información válida , útil desconocida y comprensible de una gran base de datos sin conocimiento previo, para obtener patrones y/o relaciones sistemáticas entre variables.

¿Qué es Data Mining ? Campo interdisciplinario que reune técnicas de Aprendizaje Automático Reconocimiento de Patrones, Estadística , Bases de Datos y Visualización para el análisis de los datos orientado al descubrimiento

Data Mining Mayor dimensionalidad del problema. Las técnicas de data mining permiten encontrar relaciones inéditas y continuar el análisis sobre las variables más interesantes.

SOFTWARE IBM Intelligent Miner. ISL Decision Systems, INC Clementine (SPSS). SAS Corporation, “SAS Enterprise Miner”. Silicon Graphics: “MineSet”. Salford Systems. Statistica Miner. SPAD N (Numérico) T (Textual – Datos Simbólicos) SODAS Los vendedores tanto de software como de hardware tratan de capitalizar el boom de DM y el mercado comienza a saturarse. Paquetes cuyo costo oscila entre u$ 50.000 y u$ 100.000 y mucho entrenamiento. Ademas de estos paquetes generales hay otros más específicos.

Los pasos para un proceso de KDD Base de datos Selección de datos Procesamiento Transformación Data Mining: (características, análisis de informaciones extraídas, asimilación, interpretaciones).

MÉTODOS ESTADÍSTICOS Análisis factorial Análisis de Agrupamiento Componentes principales Análisis factorial Análisis de Agrupamiento Análisis discriminante Regresión Logística

OTROS MÉTODOS Redes neuronales. Árboles de decisión. Reglas de Asociación. Modelos Gráficos. Algoritmos genéticos. Sistemas de lógica difusa. Máquinas de Soporte vectorial

TEXT MINING Identificar los términos y conceptos más frecuentemente usados en una base de datos de textos (documentos), descubrir asociaciones entre ellos.

Data Mining y Análisis estadístico El análisis estadístico: procedimiento hipotético-deductivo, técnicas confirmatorias. DM es un proceso inductivo, que utiliza técnicas generalmente exploratorias. DM se utilizará cuando no tenemos supuestos de partida y pretendemos buscar algún conocimiento nuevo.

Data Mining y Análisis Estadístico Las soluciones que aporta Data Mining están basadas en la implementación, mediante la programación de interfases de uso general y algoritmos propios y disponibles para todos, que permiten una exploración y organización eficiente de los datos apoyan la identificación de patrones, relaciones y anomalías de interés potencial para quienes deben tomar decisiones.

APLICACIONES Text Mining Web Mining Detección de fraudes Bioinformática

Actualizar Nuevas Herramientas Nuevos Productos Nuevos Dominios de Aplicación Mejorar Herramientas Existentes

Maestría en Explotación de Datos y Descubrimiento del Conocimiento Carrera de especialización 1 Año Maestría 1 Año adicional

Organización Proyecto conjunto de las Facultades de Ciencias Exactas y Naturales y Facultad de Ingenierìa de la UBA

Objetivos Formación Carrera de Especialización y Maestría Investigación : Proyectos Consultoría: Cooperación y complementación

Organización Director, Co-Director, Vice- Director Comité Asesor Soporte Técnico Soporte Administrativo Sede Administrativa Facultad Ciencias Exactas y Naturales ,Pabellón II Sede Académica FCEyN. Pabellón I Facultad de Ingeniería (Paseo Colón)

Titulos Especialista una vez aprobadas las seis asignaturas del primer año. Magister aprobadas las seis asignaturas de segundo año y la defensa de una Tesis

Admisión Pueden Ingresar Graduados de la UBA con titulo de grado de carreras de cuatro años de duración y graduados de otras instituciones con títulos equivalentes, Graduados de carreras de duración menor luego de aprobar prerrequisitos o cursos de nivelación Importante :Vocación interdisciplinaria de la Maestría.

Dictado Presencial Clases Teórico-Prácticas Asistencia no- obligatoria Apoyo mediante la Web y prácticas de Laboratorio Alumnos regulares y vocacionales

Algunos números Alumnos inscriptos 2004 30 2005 31 2006 36 2007 36 2005 31 2006 36 2007 36 2008 40 Primeras Jornada en 2006 150 Segundas Jornadas en 2007 190 Terceras Jornadas en 2008 220

Algunos Datos Soporte de Laboratorio Servidor HP ML 350 Apoyo de empresas de software

Desarrollo de una metodología de extracción de conocimientos a partir de micromatrices de DNA basada en ontologías genéticas Tesis presentada para optar al Título de Magister Autor: Lic. en Sist. Armando Taié Director: Dra. Ana Silvia Haedo Co-Directores: Dra. Norma Paniego Dr. Marcelo Soria Buenos aires, Diciembre de 2008