Métodos clasificación

Slides:



Advertisements
Presentaciones similares
Análisis y la presentación de los datos
Advertisements

Data Mining Minería de Datos Universidad Tecnológica Metropolitana
Árboles de decisión Tema 9 Parte teórica Minería de datos
Regresión lineal simple
Regresión mínimo cuadrada (I)
Técnicas para el análisis de datos en el enfoque cuantitativo
Algoritmos de Minería Los métodos básicos.
Correlación ©1997-Sep-06 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras.
MÉTODOS DE MEDICIÓN DE COSTOS.
• SQL Server Analysis Services Data Mining
K-NN: K vecinos más cercanos
UNIVERSIDAD AUTÓNOMA DEL CARIBE
TMiner Data Mining en Java
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a
TEMA 8: ANÁLISIS DE LA REGRESIÓN Y CORRELACIÓN ENTRE DOS VARIABLES
بسم الله الرحمن الرحيم.
Regresión Lineal Simple
Curso de Estadística Básica
Análisis de Correlación y de Regresión lineal simple
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
MÉTODOS DE PROYECCIÓN Existen varias alternativas para determinar el comportamiento futuro de un producto, lo cual exige de los proyectistas, un análisis.
Técnicas estadísticas paramétricas univariantes: regresión
Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".
REGRESION Y CORRELACION
BIOMETRIA II TEMA 2 El Modelo de Regresión.
ANÁLISIS DE CONGLOMERADOS
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Pronósticos Los pronósticos y la planeación de la capacidad de mantenimiento son dos funciones importantes para el diseño de un sistema de mantenimiento.
Aprendizaje Automatizado Ár boles de Clasificación.
• SQL Reporting Services
INVESTIGACION DE OPERACIONES
Regresión logística.
Regresión No- lineal y Múltiple
ING. ADA PAULINA MORA GONZALEZ. Análisis de regresión Es la técnica que se usa para desarrollar la ecuación de la línea y poder realizar predicciones.
Aprendizaje en Árboles de Decisión
Nube de puntos: Material de Prfa.Dra. Rosario Martínez Verdú.
Regresión lineal múltiple
Introducción al AM Daniel Peña.
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
CLASE x x + 8 x – 3 – 2 x 3 – 4 x 2 4 x 2 – x x x + 6 x x x x2 2x2 2x2 2x2 – 4 x – 1 – 3 – – – – (3)  2x32x3 2x32x3.
ALUMNA: I. CLAUDIA AVILA LEON MATRICULA TUTORA: NATALIA PEREZ RUL MATERIA: FORMULACION Y EVALUACION DE PROYECTOS ACTIVIDAD: METODO DE MINIMOS.
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
ANÁLISIS DE REGRESIÓN SIMPLE
DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.
 La matemática indica una problema de resolver las multiplicaciones y divisiones y raíz cuadrada indica todo los objeto de materiales que puede resolver.
Planificación de transporte UNIDAD V: GENERACION DEL MOVIMIENTO DE PASAJEROS EL EMPLEO DE ANALISIS DE REGRESION Múltiple EN LA PREDICCION DE FUTURA.
Presentado por: carolina gallardo Universidad metropolitana de B/quilla.
SERIES DE TIEMPO Suscribase a SERIES DE TIEMPO Suscribase a
CLASE 76 REPRESENTACIÓN DE FUNCIONES.
Coeficiente de determinación y análisis de varianza de la regresión
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
TEMARIO CUARTA Y QUINTA CLASE 1. Metodologías para analizar la probabilidad de Incumplimiento de pagos de créditos Análisis Cuantitativo con Variables.
Aplicación JAVA implementando Arboles de Decisión
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
TEMA : ANALISIS DE REGRESION
Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
Un Método Cuantitativo podría definirse como aquellos modelos matemáticos puesto al servicio de los procesos de resolución de problemas de un modo racional.
CARACTERÍSTICAS ESPECIALES DE LA EXTRACCIÓN DE CONOCIMIENTO DE INFO. NO ESTRUCTURADA Objetivos ligeramente Especiales: Búsqueda de Información Relevante.
INTRODUCCIÓN A LA ECONOMETRÍA
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
UNIDAD 1. Escribe en tu cuaderno Todo número compuesto puede expresarse como una multiplicación única de factores primos. Esta multiplicación se denomina.
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
Tema 4: Análisis de datos bivariantes numéricos (continuación)
ANOVA DE UN FACTOR. Diferencias de Medias Independientes Dependientes Diferencias de Varianzas.
Tiempo (s) Distancia (m) t (s) d (m)
Transcripción de la presentación:

Métodos clasificación

Regresión Mínimos cuadrados minimizando la distancia entre dos grupos de variables Dependiente vs independiente (s) Múltiples variables

Regresión Puede ser usado para predicción

Arboles de decisión

Arboles de decisión Método usado en Data Mining Arboles de regresión Respuesta es continua Arboles de clasificación Respuesta es discreta Hojas son clases finales Ramas son reglas matemáticas de división (conjunciones)

Entropia Impuridad en entropia Objeto es minumiza ΔR

Coeficiente de GINI Indice de impuridad de GINI L(i,j) describe la perdida de

Comparacion de método GINI e Información

Ejemplotree.r #ejemplo de arbol de clasificación install.packages('rpart') library(rpart) progstat <- factor(stagec$pgstat, levels=0:1, labels=c("No", "Prog")) cfit <- rpart(progstat ~ age + eet + g2 + grade + gleason + ploidy, data=stagec, method='class') print(cfit) plot(cfit) text(cfit)

fit <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis) parms = list(prior = c(.65,.35), split = "information")) fit3 <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis, control = rpart.control(cp = 0.05)) par(mfrow = c(1,2), xpd = NA) # otherwise on some devices the text is clipped plot(fit) text(fit, use.n = TRUE) plot(fit2) text(fit2, use.n = TRUE)

Arboles de decisión Variable está en valores discretos y valores continuos asociados Ej. Temperatura (grados) – temp (caliente, tibio,frio) Funcion es en valores discretos (clasificación) Disjunciones deben estar presentes Set de entrenamiento puede tener errores Set de entrenamiento puede tener datos faltantes

Support vector machines Desarrollados para clasificaciones binarias Yes/no Busca el hiperplano optimo que separa las categorias al maximizar las diferencias entre los puntos mas cercanos en diferentes clases

Support vector machines

Clasificacion de coberturas (modis)

Ejemplo en ejemplosvm.r install.packages('e1071') #el ejemplo se encuentra con ?svm library(e1071) data(iris) attach(iris) ## classification mode # default with factor response: model <- svm(Species ~ ., data = iris) # alternatively the traditional interface: x <- subset(iris, select = -Species) y <- Species model <- svm(x, y) print(model) summary(model)

pred <- predict(model, x) # (same as:) pred <- fitted(model) # Check accuracy: table(pred, y) # compute decision values and probabilities: pred <- predict(model, x, decision.values = TRUE) attr(pred, "decision.values")[1:4,] # visualize (classes by color, SV by crosses): plot(cmdscale(dist(iris[,-5])), col = as.integer(iris[,5]), pch = c("o","+")[1:150 %in% model$index + 1])