 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.

Slides:



Advertisements
Presentaciones similares
Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Advertisements

DATA MINING MINERIA DE DATOS Gersom Costas.
Data Mining Integrantes: Rojas Correa, Trinidad Romanskyy, Bohdan
REDES NEURONALES ARTIFICIALES
ERICK CISNEROS SAAVEDRA GABRIELA REGULES GUTIÉRREZ Datamining.
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.

1 Introducción a la minería de datos. 2 Temario ¿Qué es minería de datos? ¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Quién usa minería de.
TAREA 1 SISTEMAS DE IDENTIFICACION. SINTESIS La primera etapa es la identificación del problema, implica la recopilación de datos que describen las diferentes.
Traducción dirigida por la Sintaxis Teoría de Autómatas y Lenguajes Formales Alma María Pisabarro, 2007.
TUTORIA 1 Lógica para la Computación TUTORIA 1 Facultad de Ciencias Naturales y Matemáticas.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Estándares para Matemáticas
Prof. James McPhee Depto. Ingeniería Civil
Metodología de la investigación
Pedro Salcedo, Angélica Pinninghoff, Ricardo Contreras
Ingreso , proceso y salida de datos
Sistematización de Experiencias Educativas.
EXPOSITOR L.C. EDUARDO M. ENRÍQUEZ G.
Pedro Letelier Patricio Contreras
Introducción La optimización trata de buscar el punto óptimo de una función objetivo cumpliendo con una serie de restricciones. El proceso de optimización.
Aprendizaje ¿Cómo aprendemos?.
Autor: Araya P., Ruz G., Palomino H.
INSTITUTO NACIONAL DE SAN ISIDRO (INSI) MUNICIPIO DE SAN ISIDRO, DEPARTAMENTO DE MORAZÁN. ASIGNATURA: INFORMATICA. TEMA: LA QUINTA GENERACION DE LAS COMPUTADORAS.
INTRODUCCIÓN AL ESTUDIO DE LA ESTADÍSTICA
SOM: Modelos de mapas Auto-organizativos
Conceptos Básicos de Programación
Inteligencia Computacional
Tema 6. Conceptos básicos de programación (Clase 2)
Tema 7. Diseños evaluativos de intervención media (cuasi-experimentos)
1º BTO.
ADMINISTRACION DE LA PRODUCCION II 2017
PREDICCIÓN Y ESTIMACIÓN
REGRESÍON LINEAL SIMPLE
Etapas de la simulación de procesos
Seminario de Titulación (4)
Algoritmo Capitulo Cinco.
RODRÍGUEZ CARRANZA SARAÍ ABI
MINIESPECIFICACIONES
Modelo de interacción de usuario.  El Desarrollo basado en modelos de la interfaz de usuario, en inglés Model-based User Interface Development (MB-UID),
MODALIDADES DE LA INVESTIGACION Jenkellyz Suarez C.I Instituto universitario Politécnico Santiago marino Extensión edo-Tachira MARZO 2018.
CONCEPTOS DE PSICOLOGIA Vamos a considerar palabra por palabra de esta definición. El término psicología proviene de las palabras griegas psyche (alma)
Conjunto de procedimientos que permiten abordar un problema de investigación con el fin de lograr objetivos determinados. MÉTODO Descripción a detalle.
Metodología de la Investigación
Redes Neuronales Artificiales
MÉTODO CIENTÍFICO.
EL PROCESO: SU ENFOQUE INTERVENTIVO-VALORATIVO. Selección de medidas de las variables dependientes e independientes Criterios de selección de las medidas.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
La Investigación Científica
LAS ETAPAS DE LA SIMULACION NUMERICA
ELEMENTOS DE CONTENIDO Y ALCANCE
Dr. Carlomagno Araya Alpízar
INTRODUCCIÓN A LA IDENTIFICACIÓN DE SISTEMAS
INVESTIGACIÓN CIENTÍFICA
Lingüística computacional
Tema 6. Conceptos básicos de programación (Clase 2)
INSTITUTO TECNOLOGICO DE VERACRUZ
 Es básicamente un proceso automático en el que se combinan descubrimiento y análisis.  El proceso consiste en extraer patrones en forma de reglas o.
NATURALEZA DE LOS DATOS Valores Numéricos Son los valores que se pueden hacer cálculos aritméticosritméticos Tipos de valores Entero Real Cadena ( “ h”
1 DATA MINING Arantza Garcia Arrastia Curso 2004/2005.
CONTROLES Y ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN  1. Algoritmos: conjunto de instrucciones programadas para resolver una tarea específica.  2. Datos:
Tamaño de muestra.
ESTADÍSTICA DESCRIPTIVA Mg. JHON FREDY SABI ROJAS.
1 DATA MINING Arantza Garcia Arrastia Curso 2004/2005.
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN ¿Qué es una proyección? Es una estimación del comportamiento de una variable en el futuro. Específicamente, se.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Sustentación de Paper Curso : MN 463 Sección : “C” Docente : Morales-Tarqui Oswaldo Morla Alumno : Josué Gabriel Díaz Saavedra Código : D Fecha.
TIPOS DE ALGORITMO DE APRENDIZAJE Aprendizaje Supervisado Aprendizaje no Supervisado Aprendizaje por Refuerzo.
Transcripción de la presentación:

 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las ciencias de la computación referido al proceso que intenta descubrir patrones en grandes volúmenes de conjuntos de datos. 1 ​ Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. 1

 1.Selección del conjunto de datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el cálculo o proceso), como posiblemente al muestreo de los registros disponibles.  2.Análisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).  3.Transformación del conjunto de datos de entrada, se realizará de diversas formas en función del análisis previo, con el objetivo de prepararlo para aplicar la técnica de minería de datos que mejor se adapte a los datos y al problema, a este paso también se le conoce como preprocesamiento de los datos.

 4.Seleccionar y aplicar la técnica de minería de datos, se construye el modelo predictivo, de clasificación o segmentación.  5.Extracción de conocimiento, mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables. También pueden usarse varias técnicas a la vez para generar distintos modelos, aunque generalmente cada técnica obliga a un preprocesado diferente de los datos.  6.Interpretación y evaluación de datos, una vez obtenido el modelo, se debe proceder a su validación comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.

 Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Algunos ejemplos de red neuronal son: Redes neuronales Regresión linealRegresión lineal.- Es la más utilizada para formar relaciones entre datos. Rápida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse más de 2 variables. Árboles de decisiónÁrboles de decisión.- Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la inteligencia artificial y el análisis predictivo, dada una base de datos se construyen estos diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolución de un problema.

 Modelos estadísticos.- Es una expresión simbólica en forma de igualdad o ecuación que se emplea en todos los diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta. Modelos estadísticos  Agrupamiento o Clustering.- Es un procedimiento de agrupación de una serie de vectores según criterios habitualmente de distancia; se tratará de disponer los vectores de entrada de forma que estén más cercanos aquellos que tengan características comunes. Ejemplos: Agrupamiento o Clustering  Algoritmo K-means Algoritmo K-means  Algoritmo K-medoids Algoritmo K-medoids  Reglas de asociación.- Se utilizan para descubrir hechos que ocurren en común dentro de un determinado conjunto de datos. Reglas de asociación  Según el objetivo del análisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):  Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos.  Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos.