SVM en R, el paquete e1071 > names(tinto)

Slides:



Advertisements
Presentaciones similares
Profesor: Noé Becerra Rodríguez 26 de septiembre 2013
Advertisements

ANÁLISIS ESTADÍSTICO COMPUTARIZADO
Multiplicación y división de números decimales
Omar José Yamil Naivy Eidy Dulbis Yimer Papá Hijos
05- RECONOCIMIENTOS v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Cuestiones y problemas
Cuestiones y problemas
Presentación Tecnologica
Agrupación de datos cuantitativos definiciones básicas y otras explicaciones.
MuestraMétodo a prueba Nominal Ejercicio 1. ¿Es exacto el método?
MATEMÁTICAS 8° BÁSICO PROGRAMA EMPRENDER PREUNIVERSITARIO ALUMNOS UC
Descomposición Como … entonces ... Restando el complementario
Álgebra 2010 Clase N° 1 Conjuntos numéricos I
ESTADÍGRAFOS DE DISPERSIÓN
JUAN JOSÉ VENEGAS MORENO
> xi par(mfrow=c(1,3)) > hist(xi, breaks=4, main="4 bins") > hist(xi, breaks=6,
Error Estándar de la Media
Unidad de competencia II Estadística descriptiva:
HORARIO.
PRUEBA DE APTITUD ACADÉMICA RAZONAMIENTO MATEMÁTICO
Circuitos de Conmutación
Sistema operativo Tema: Maquina virtual Alumnos: Eduar peña
29/03/2017 ROUTING IP Herramientas Basicas Redes Convergentes.
Solución de problema Herramientas aplicables
MATEMÁTICAS: TEMA 2 Sumamos, restamos y aprendemos las horas.
Buenos días a todos. Muchas gracias por estar aquí para las primeras charlas de esta edición de Anaporc de La verdad, es que el lugar elegido este.
Parámetros estadísticos
50: millón Bienvenidos a.
Proyecto ProMéxico Plasmas mayo SECCIONES NOTICIAS PROYECTOS UNIDAD ACTÚA EVENTUALES secciones ProMéxico.
Estado nutricional del recién nacido en relación al EN pregestacional materno y a la ganancia de peso gestacional. Salta. 2002/2009 Mónica Couceiro y Laura.
Fenómenos químicos U.1Sustancias y mezclas
INGENIO ATENCINGO, PUEBLA
Docente: Jorge E. Cigarán
FUNCIONES POLINÓMICAS DE SEGUNDO GRADO
CLASE 9 INF234 Modelos de Simulación Empresarial MODELOS DE SIMULACIÓN EMPRESARIAL CLASE 9 14.Estados Financieros (3ra Parte)
MEDIDAS DE DISPERSIÓN.
¿Cómo conocer los datos globales de la UCM?. Tenemos varias opciones de informes globales. Utilizaremos las dos primeras: Executive Summary Sumary Metrics.
Productos de los alumnos de 4º D del I.E.S Marqués de Villena
Similar al ejercicio 1 propuesto Método de sustitución
Introducción al Diseño de Experimentos para el Reconocimiento de Patrones Capítulo 7: Máquinas de Vectores Soporte Curso de doctorado impartido por Dr.
1 Para editar los resultados obtenidos usamos File -> Edit.
Solución de problema Herramientas aplicables
Estudio del movimiento
Fase Regional de mayo de 2014
Ecuación de Underwood para separaciones de clase 2: raíz común
Números enteros.
Jorge Nasazzi Oficial Nacional de Desarrollo UAR DEFENSA DEL LINE OUT Algo para tener en cuenta.
SISTEMAS DE ECUACIONES RESOLUCIÓN POR EL METODO DE GAUSS
CLASE 17 QUÍMICA ORGÁNICA IV.
Prof. mary nelly Cascante durán. 1 masa 2 temperatura 3 Volumen 4 peso  Todo lo que ocupa un lugar en el espacio, y posee:
¿Qué hora es? Avancemos U2L1 La hora. On the hour… en punto Es la una. ◦It’s 1:00  Use es la only for the one hour (it is singular) Son las dos. ◦???
@ Angel Prieto BenitoMatemáticas Acceso a CFGS1 Bloque IV * Tema 157 Distribuciones BIDIMENSIONALES.
ESTADÍSTICA UNIDIMENSIONAL
WINTER Práctica 1.8 Template.
Progresiones Aritméticas
Almendrados Descripción: Ingredientes: Peso: Precio:
Taller de inmersión AGUA, COMPUESTO ESENCIAL DE LA VIDA: ASPECTOS QUÍMICOS Y BIOLÓGICOS.
USO RACIONAL DEL SO2 EN COSECHA Y ELABORACION Ricardo Galante Enólogo.
Simulacion de sistemas dinamicos
Estadísticas April 11, 2017.
CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X 
BOOSTING REGRESSION TREES CON STATISTICA TÉCNICAS AVANZADAS DE REGRESIÓN EN CIENCIAS NATURALES Y SU APLICACIÓN CON R Luis M. Carrascal & Javier Seoane.
Presentation Created by Dr. Luis O. Jiménez Design & Validation of Classifiers Machine Learning Design & Validation of Classifiers.
1 Y MODELO DE REGRESIÓN SIMPLE Suponemos que una variable Y es una función lineal de otra variable X, con parámetros desconocidos  1 y  2 que queremos.
La Desviación Media Unidad IV MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Elaborado por: Delia López Cerqueda Laura Hortensia Jiménez Estrada.
Su valor de verdad solo es VERDADERO SI todos sus operandos son VERDADEROS, de lo contrario su valor de verdad es FALSO. A B A ^ B V F V V F F F V F.
Clase 1. Clase 7 Clase 8.
AUIDOLINGUAL METHOD.
Regresión (II).
Clase
Transcripción de la presentación:

SVM en R, el paquete e1071 > names(tinto) [1] "fixed.acidity" "volatile.acidity" [3] "citric.acid" "residual.sugar" [5] "chlorides" "free.sulfur.dioxide" [7] "total.sulfur.dioxide" "density" [9] "pH" "sulphates" [11] "alcohol" "quality" Trabajamos con el dataset de vinos tintos verdes portugueses > unique(tinto$quality) [1] 5 6 7 4 8 3 > qualcod <- ifelse(tinto$quality %in% c(7,8), 1, -1) > table(qualcod) qualcod -1 1 1382 217 Separamos en dos clases los vinos de categoría 7 y 8 del resto

SVM en R, el paquete e1071 > ind <- 1:nrow(tinto) > testind <-sample(ind, trunc(length(ind)/3)) > tinto <- data.frame(tinto, qualcod) > testset <- tinto[testind, -12] > trainset <- tinto[-testind, -12] > tinto.tunesvm <- tune.svm(as.factor(qualcod)~., data=trainset, gamma=2^(-3:3), cost=2^(0:4)) > summary(tinto.tunesvm) Parameter tuning of ‘svm’: - sampling method: 10-fold cross validation - best parameters: gamma cost 1 2 - best performance: 0.0956974 Detailed performance results: gamma cost error dispersion 1 0.125 1 0.11728090 0.01498582 2 0.250 1 0.11447716 0.02505541 ...

SVM en R, el paquete e1071 Con la función tune.svm se puede recorrer una grilla de valores de los parámetros y obtener la mejor combinación. En el caso anterior: gamma =1 C=2 > plot(tinto.tunesvm) > tinto.svm <- tinto.tunesvm$best.model > tinto.svm.pred <- predict(tinto.svm, testset[,-12]) > table(predicho=tinto.svm.pred, verdadero=testset[,12]) verdadero predicho -1 1 -1 451 50 1 8 24 > (8+50)/(nrow(testset)) [1] 0.1088180

Clasificando por knn: > tinto.knn <- knn(trainset[, -12], testset[, -12], trainset$qualcod, k=15) > table(predicho=tinto.knn, verdadero=testset[,12]) > (70+2)/nrow(testset) verdadero predicho -1 1 -1 457 70 1 2 4 > (70+2)/(nrow(testset)) [1] 0.1350844