Métodos clasificación

Slides:

Advertisements

Presentaciones similares

Análisis y la presentación de los datos

Advertisements

Data Mining Minería de Datos Universidad Tecnológica Metropolitana

Árboles de decisión Tema 9 Parte teórica Minería de datos

Regresión lineal simple

Regresión mínimo cuadrada (I)

Técnicas para el análisis de datos en el enfoque cuantitativo

Algoritmos de Minería Los métodos básicos.

Correlación ©1997-Sep-06 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras.

MÉTODOS DE MEDICIÓN DE COSTOS.

• SQL Server Analysis Services Data Mining

K-NN: K vecinos más cercanos

UNIVERSIDAD AUTÓNOMA DEL CARIBE

TMiner Data Mining en Java

Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.

Modelado y simulación en Ingeniería Química. Manuel Rodríguez

Especialista en Business Intelligence Analysis Services SSAS (Sesión 14) Microsoft SQL Server 2008 R2 Suscribase a o escríbanos a

TEMA 8: ANÁLISIS DE LA REGRESIÓN Y CORRELACIÓN ENTRE DOS VARIABLES

بسم الله الرحمن الرحيم.

Regresión Lineal Simple

Curso de Estadística Básica

Análisis de Correlación y de Regresión lineal simple

SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

MÉTODOS DE PROYECCIÓN Existen varias alternativas para determinar el comportamiento futuro de un producto, lo cual exige de los proyectistas, un análisis.

Técnicas estadísticas paramétricas univariantes: regresión

Diplomado "Gestión de Negocios con Data Warehouse y Data Mining".

REGRESION Y CORRELACION

BIOMETRIA II TEMA 2 El Modelo de Regresión.

ANÁLISIS DE CONGLOMERADOS

Pronósticos, Series de Tiempo y Regresión

Pronósticos, Series de Tiempo y Regresión

Pronósticos Los pronósticos y la planeación de la capacidad de mantenimiento son dos funciones importantes para el diseño de un sistema de mantenimiento.

Aprendizaje Automatizado Ár boles de Clasificación.

• SQL Reporting Services

INVESTIGACION DE OPERACIONES

Regresión logística.

Regresión No- lineal y Múltiple

ING. ADA PAULINA MORA GONZALEZ. Análisis de regresión Es la técnica que se usa para desarrollar la ecuación de la línea y poder realizar predicciones.

Aprendizaje en Árboles de Decisión

Nube de puntos: Material de Prfa.Dra. Rosario Martínez Verdú.

Regresión lineal múltiple

Introducción al AM Daniel Peña.

LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014

CLASE x x + 8 x – 3 – 2 x 3 – 4 x 2 4 x 2 – x x x + 6 x x x x2 2x2 2x2 2x2 – 4 x – 1 – 3 – – – – (3)  2x32x3 2x32x3.

ALUMNA: I. CLAUDIA AVILA LEON MATRICULA TUTORA: NATALIA PEREZ RUL MATERIA: FORMULACION Y EVALUACION DE PROYECTOS ACTIVIDAD: METODO DE MINIMOS.

Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.

ANÁLISIS DE REGRESIÓN SIMPLE

DATA MINING KAROL PARDO MIGUEL VALCERO CORPORACION UNIVERSITARIA MINUTO DE DIOS.

 La matemática indica una problema de resolver las multiplicaciones y divisiones y raíz cuadrada indica todo los objeto de materiales que puede resolver.

Planificación de transporte UNIDAD V: GENERACION DEL MOVIMIENTO DE PASAJEROS EL EMPLEO DE ANALISIS DE REGRESION Múltiple EN LA PREDICCION DE FUTURA.

Presentado por: carolina gallardo Universidad metropolitana de B/quilla.

SERIES DE TIEMPO Suscribase a SERIES DE TIEMPO Suscribase a

CLASE 76 REPRESENTACIÓN DE FUNCIONES.

Coeficiente de determinación y análisis de varianza de la regresión

CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL

TEMARIO CUARTA Y QUINTA CLASE 1. Metodologías para analizar la probabilidad de Incumplimiento de pagos de créditos Análisis Cuantitativo con Variables.

Aplicación JAVA implementando Arboles de Decisión

Regresión lineal simple Nazira Calleja

Unidad 4 Análisis de los Datos.

TEMA : ANALISIS DE REGRESION

Taller de Inteligencia de Negocios SQL Server Analysis Services Data Mining Semana 11.

Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.

Un Método Cuantitativo podría definirse como aquellos modelos matemáticos puesto al servicio de los procesos de resolución de problemas de un modo racional.

CARACTERÍSTICAS ESPECIALES DE LA EXTRACCIÓN DE CONOCIMIENTO DE INFO. NO ESTRUCTURADA Objetivos ligeramente Especiales: Búsqueda de Información Relevante.

INTRODUCCIÓN A LA ECONOMETRÍA

REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.

UNIDAD 1. Escribe en tu cuaderno Todo número compuesto puede expresarse como una multiplicación única de factores primos. Esta multiplicación se denomina.

M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.

Tema 4: Análisis de datos bivariantes numéricos (continuación)

ANOVA DE UN FACTOR. Diferencias de Medias Independientes Dependientes Diferencias de Varianzas.

Tiempo (s) Distancia (m) t (s) d (m)

Transcripción de la presentación:

Métodos clasificación

Regresión Mínimos cuadrados minimizando la distancia entre dos grupos de variables Dependiente vs independiente (s) Múltiples variables

Regresión Puede ser usado para predicción

Arboles de decisión

Arboles de decisión Método usado en Data Mining Arboles de regresión Respuesta es continua Arboles de clasificación Respuesta es discreta Hojas son clases finales Ramas son reglas matemáticas de división (conjunciones)

Entropia Impuridad en entropia Objeto es minumiza ΔR

Coeficiente de GINI Indice de impuridad de GINI L(i,j) describe la perdida de

Comparacion de método GINI e Información

Ejemplotree.r #ejemplo de arbol de clasificación install.packages('rpart') library(rpart) progstat <- factor(stagec$pgstat, levels=0:1, labels=c("No", "Prog")) cfit <- rpart(progstat ~ age + eet + g2 + grade + gleason + ploidy, data=stagec, method='class') print(cfit) plot(cfit) text(cfit)

fit <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis) parms = list(prior = c(.65,.35), split = "information")) fit3 <- rpart(Kyphosis ~ Age + Number + Start, data = kyphosis, control = rpart.control(cp = 0.05)) par(mfrow = c(1,2), xpd = NA) # otherwise on some devices the text is clipped plot(fit) text(fit, use.n = TRUE) plot(fit2) text(fit2, use.n = TRUE)

Arboles de decisión Variable está en valores discretos y valores continuos asociados Ej. Temperatura (grados) – temp (caliente, tibio,frio) Funcion es en valores discretos (clasificación) Disjunciones deben estar presentes Set de entrenamiento puede tener errores Set de entrenamiento puede tener datos faltantes

Support vector machines Desarrollados para clasificaciones binarias Yes/no Busca el hiperplano optimo que separa las categorias al maximizar las diferencias entre los puntos mas cercanos en diferentes clases

Support vector machines

Clasificacion de coberturas (modis)

Ejemplo en ejemplosvm.r install.packages('e1071') #el ejemplo se encuentra con ?svm library(e1071) data(iris) attach(iris) ## classification mode # default with factor response: model <- svm(Species ~ ., data = iris) # alternatively the traditional interface: x <- subset(iris, select = -Species) y <- Species model <- svm(x, y) print(model) summary(model)

pred <- predict(model, x) # (same as:) pred <- fitted(model) # Check accuracy: table(pred, y) # compute decision values and probabilities: pred <- predict(model, x, decision.values = TRUE) attr(pred, "decision.values")[1:4,] # visualize (classes by color, SV by crosses): plot(cmdscale(dist(iris[,-5])), col = as.integer(iris[,5]), pch = c("o","+")[1:150 %in% model$index + 1])