Gráficos en R Seminario CEH-CEDEX 21-22 Febrero, 2011.

Slides:



Advertisements
Presentaciones similares
Profesor: Noé Becerra Rodríguez 26 de septiembre 2013
Advertisements

DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Pronósticos de Ventas. Pronóstico:
Conocimiento, Uso y Evaluación de Medicamentos Genéricos
SATISFACCIÓN DE CLIENTES Comparativa Convocatorias Finalizadas en 2011.
Los números del 0 al cero uno dos tres cuatro cinco 6 7 8
1 ESTUDIO DE OPINIÓN PÚBLICA: LA SEXUALIDAD DE LOS CHILENOS ABRIL 2006 ¿Informados o desinformados? Principal fuente de información Las enseñanzas durante.
Junio 2008 Índice de Paz Ciudadana Junio 2008Adimark-GfKPaz Ciudadana 1 Índice Paz Ciudadana – Adimark Santiago, 10 de septiembre de 2008 Conferencia de.
Noviembre 2007Estudio Rostros de Noticias 2007Collect-GfKWikén Estudio Rostros de Noticias de la TV Chilena Desarrollados para Revista Wikén El Mercurio.
COMPARATIVA CONVOCATORIAS FINALIZADAS EN Bilbao, Satisfacción de Clientes OBJETO Y ALCANCE Convocatorias finalizadas en 2012.
Variables Sherine Shawky, MD, Dr.PH Profesor asistente
RELACIÓN POSTULADOS POR SEXO
1 LA UTILIZACION DE LAS TIC EN LAS MICROEMPRESAS GALLEGAS. AÑO mayo 2005.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
AYUDA A LA FUNCIÓN DOCENTE Internet
Presentación de datos e interpretación de resultados
TEMA 2 MÚLTIPLOS Y DIVISORES
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
02- PLAN DOCENTE Febrero 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
01- OFERTA FORMATIVA v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
Aladdín-respuestas 1.Vivía 2.Era 3.Amaba 4.Quería 5.Gustaban 6.Se sentía 7.Salía 8.Tenía 9.Decidió 10.escapó 11. Se vistió 12. Conoció 13. Vio 14. Pensó
Respuestas Buscando a Nemo.
ABECEDARIO FIGURAS GEOMÉTRICAS NÚMERO
Clase 16 Jairo y su hija. La mujer con flujo de sangre. Dos ciegos.
ANALISIS DE DATOS CUANTITATIVOS
Árboles de decisión Tema 9 Parte teórica Minería de datos
CAPÍTULO 2 Elaboración y utilización de gráficas
Área Razón Social 0 0 Telefónica Servicios Audiovisuales S.A. / Telefónica España S.A. Título de la ponencia / Otros datos de interés / Kit.
DISEÑO DE EXPERIMENTOS
Descripción de los datos: medidas de ubicación
Capítulo 3 Descripción de datos, medidas de tendencia central
Estructura Económica de México Prof. Abelardo Mariña Flores trimestre 2010-P.
1 XML Extensible Markup Language HTML HyperText Markup Language normas06_01.xml.
PRACTICOS.
CONTROL ESTADÍSTICO DE PROCESOS
Generación de Números Seudo-Aleatorios
William Shakespeare ( greg.), fue un dramaturgo, poeta y actor inglés. Conocido en ocasiones como el Bardo de Avon (o.
Grupos de Edad Ocupación Nivel Socioeconómico.
PREVENCION DE RIESGOS PROFESIONALES EN CHILE
Parte 3. Descripción del código de una función 1.
Vocabulario querer comerlo -paja por supuesto - madera
Estadística Lic. Olga S. Filippini.
Encuesta de Salud Bucodental en Escolares 2004
FUNCIONES DE UNA VARIABLE REAL
Dr. Fernando Galassi - Lic. Gisela Forlin
EL OSO APRENDIZ Y SUS AMIGOS
1 PROYECTO DE PRESUPUESTO DE EGRESOS DE LA FEDERACION 2002 COORDINACIÓN DE POLITICA ECONOMICA GP-PRD.
Estadística Anual Agenda Metodología Mercado 2006 –Resultados por categoría en Millones de Pesos y Unidades.
Indicadores CNEP Escuela
CAPÍTULO 2 Elaboración y utilización de gráficas
Ecuaciones Cuadráticas
¡Primero mira fijo a la bruja!
Gráficas Enfoque en los números 1.
Baremos del Test de Dominos
1. Datos prensa. Fuente: ACEM
Aqui está Señoras y Señores !!!!!
JORNADA 1 DEL 24 DE MARZO AL 30 DE MARZO EQUIPO 01 VS EQUIPO 02 EQUIPO 03 VS EQUIPO 06 EQUIPO 05 VS EQUIPO 10 EQUIPO 07 DESCANSA EQUIPO 08 VS EQUIPO 13.
Introducción al lenguaje R Sesión 4 / Gráficos en R
By: Nicholas, Rayna, Nathaniel, Calvin
Introducción al lenguaje R Sesión 2: Objetos en R
Los números. Del 0 al 100.
Ps. Walter Iván Abanto Vélez.  Es el proceso de aplicar una prueba a una muestra representativa de personas que la responden con el propósito de establecer.
Los Numeros.
1 Antonio Pérez Carrasco - 16 / Mayo / Mejorando SRec mediante el análisis de su utilización Mejorando SRec mediante el análisis de su utilización.
1 8 de febrero del Chapter 5 Encoding 3 Figure 5-1 Different Conversion Schemes.
Introducción al Análisis Cluster
Herramienta FRAX Expositor: Boris Inturias.
CLASE 132. nota f i 1 20,1 30,4 40,3 50,1 FiFi 3 total30 1,00 a) F 9 b) V 12 c) V % 10 d) V FiFi 30 = 0,1 FiFi  30 = 0,1.
CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X 
Transcripción de la presentación:

Gráficos en R Seminario CEH-CEDEX 21-22 Febrero, 2011

¿Porqué los gráficos? 1. Simplificar lo tedioso y lo complejo. 2. Ayuda visual. Concordante con los ojos. 3. Más accesible que una tabla. 4. Permite entender y memorizar mejor. (William Playfair, pionero de la estadística gráfica)

¿Cuándo utilizar gráficos? Datos < 20, presentar en una tabla. Si hay que aclarar un gráfico con números, utilizar tabla. Pero algunos autores discuten que la apariencia es importante… Tufte presenta un índice para medir la cantidad de información irrelevante en un gráfico: O el % de tinta del gráfico que puede ser borrado sin afectar los datos

¿Qué hay que pedir a un gráfico? Entendibilidad 1. ¿Permite el gráfico visualizar las relaciones entre las variables? 2. ¿Interactúan los elementos (color, tamaño…) en el gráfico para maximizar nuestra percepción de las relaciones entre las variables? Claridad 1. ¿Son los elementos del gráfico claramente distinguibles? 2. ¿Son los elementos más importantes del gráfico visualmente prominentes? Consistencia 1. ¿Son los elementos de los gráficos consistentes en gráficos anteriores? 2. ¿Hay nuevos elementos que requieren una descripción adicional?

¿Qué hay que pedir a un gráfico? Eficiencia 1. ¿los elementos del gráfico representan eficientemente los datos? 2. ¿Hay elementos en el gráfico que sirven a más de un propósito? Necesidad ¿Es el gráfico útil para representar estos datos? ¿Es cada elemento en el gráfico necesario? Confiabilidad 1. ¿Están los datos adecuadamente colocados en la región de datos? 2. ¿Están los datos representados adecuadamente por la escala?

Gráficos distorsionados Un gráfico no distorsiona si la representación visual de los datos es consistente con la representación numérica Intrusión de diseñadores artísticos, tienden a llenar los gráficos de elementos decorativos e inútiles que distraen, ya que piensan que los datos son aburridos. Esto ocurre en periódicos y revistas del kiosco. Gráficos tendenciosos. Ver en televisión, dependiendo del canal (elección de colores llamativos, posiciones relevantes, formas diferentes...)

Gráficos distorsionados

Gráficos distorsionados

Gráficos distorsionados ¡¡cuidado con los gráficos que se nos presentan!!! Leer bien las escalas y las variables presentadas.

Gráficos circulares (Pie Charts) Común entre personas no profesionales en estadística Si en muchas de las situaciones donde se usan se suprimieran se ahorrarían muchas hojas de papel. A veces se presenta un gráfico de pastel para mostrar que en una muestra el 50% son hombres y el 50% mujeres (?!?!?!?)

Gráficos circulares (pie charts) read.table("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009; attach(emb2009) table (tipo) = tipotable pie (tipotable, col=c(1:8), main= " Tipos Embalses")

Gráficos de barras tN <- table(Ni <- stats::rpois(10000, lambda=5)) r <- barplot (tN, col=rainbow(20)) lines (r, tN, type='h', col='red', lwd=2)

Boxplot o Caja de Tukey read.table("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) boxplot ( IBMWP ~ cuenca, col=c("yellow","blue" , "green","red" ))

Boxplots o Cajas de Tukey Podemos añadir más modificaciones: boxplot ( IBMWP ~ cuenca, col=c("yellow","blue" , "green","red" ), notch = TRUE, main = "IBMWP por cuencas", ylab="IBMWP", xlab="cuenca", varwidth=T)

Histogramas # Generamos 100 datos aleatorios de una Chi2 x <- rchisq(100, df = 4) hist(x, freq = FALSE, nclass=9, ylim = c(0, 0.2),col=4)

Histogramas #Comparemos con la funcion de probabilidad Chi2 curve (dchisq (x, df = 4), col = 2, lty = 2, lwd = 2, add = TRUE)

Histogramas read.table("C:/AMDDATOSR/embalses2008.txt", header=T)-> emb2008; attach(emb2008) hist (area, breaks = 15, ylab="nº embalses", xlab="superficie (Ha)", main="histograma de superficie de embalses", label=T, col=(palette(gray(1-seq(0,1,len=8)))))

Diagramas de densidad de Kernel density (IBMWP) -> densibmwp plot (densibmwp, main= "Densidad índice IBMWP", xlab= "IBMWP", ylab= " densidad",xlim=c(0,300)) polygon (densibmwp, col=1)

Representando 2 variables #EJEMPLO: DISPERSIÓN read.table ("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) head (INDAGUAFLASH) cuenca SITE IVAM NFAM IBMWP IASPT 1 ALEGRIA ALE-1 4.00 23 111 4.83 2 ALEGRIA ALE-2 4.63 28 132 4.71 3 ALEGRIA ALE-5b 6.82 21 113 5.38 4 ALEGRIA ALE-10 4.00 19 81 4.26 5 ALEGRIA ALE-15 5.40 26 138 5.31 6 ALEGRIA ALE-15b 6.82 13 87 6.69 plot (INDAGUAFLASH[,3:6], col=3, pch=19)

Representando 2 variables #EJEMPLO: DISPERSIÓN read.table ("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach (INDAGUAFLASH) head (INDAGUAFLASH) cuenca SITE IVAM NFAM IBMWP IASPT 1 ALEGRIA ALE-1 4.00 23 111 4.83 2 ALEGRIA ALE-2 4.63 28 132 4.71 3 ALEGRIA ALE-5b 6.82 21 113 5.38 4 ALEGRIA ALE-10 4.00 19 81 4.26 5 ALEGRIA ALE-15 5.40 26 138 5.31 6 ALEGRIA ALE-15b 6.82 13 87 6.69 plot (INDAGUAFLASH[,3:6], col=cuenca, pch=19)

Representando 2 variables #EJEMPLO: SEN(X) #Preparamos los datos, un vector x (secuencia de 41 elementos de 1 a 2pi) #y otro vector y = seno(x) x <- seq ( from=1, to=2*pi, length=41 ) y <- sin(x) plot (x, y, col="red", cex=2) curve (sin, add=T, lwd=2)

Representando 2 variables Ciclos de atributos de símbolos: 3 colores (col) y 3 tamaños (cex): color <- c("red", "blue", "green") plot (x, y, col=color, cex=1:3, lwd=4, ylim = c(-1,1.5)) lines (x,y, lwd=2)

Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL read.table("C:/AMDDATOSR/R perfiles embalses2009.txt", header=T)->perf2009 attach(perf2009) #Dividimos nuestra matriz por el factor código de embalse, COD, split (perf2009,COD)-> perf2009 attach(perf2009$BUB) head(perf2009$BUB) COD DEP COND DO Temp pH 126 BUB 0.0 147 10.37 19.40 8.34 127 BUB 1.0 146 10.66 18.59 8.39 128 BUB 2.0 146 10.44 18.44 8.42 129 BUB 2.9 146 10.51 18.27 8.44 130 BUB 4.0 146 10.57 18.18 8.47 131 BUB 5.0 141 11.25 17.48 8.44

Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL Ejemplo, perfil de temperatura: plot (Temp, DEP, type="o", col = "red", main= "Embalse de Búbal", cex.main=.8, pch = 20, cex = 1, ylab="profundidad (m)", xlab="temperarura (ºC)", font=1, cex.axis=.7, cex.lab=.8, lwd=.7, col.axis="black", ylim=c(53,0), mgp=c(1.5, .6, 0)) axis ( 3, cex.axis=.7, tck=-.03, mgp=c(1.5,.6,0)) #savePlot ("BUBtemp",type = "emf")

Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL Ejemplo, perfil de temperatura:

Gráficos tridimensionales EJEMPLO: Visualizar un MDT # (3) Visualizing a simple DEM model z <- 2 * volcano x <- 10 * (1:nrow(z)) y <- 10 * (1:ncol(z)) persp (x, y, z, theta = 135, phi = 30, col = "green3", scale = FALSE, ltheta = -120, shade = 0.75, border = NA, box = FALSE)

Gráficos tridimensionales EJEMPLO:

Gráficos Multivariantes GRAFICOS DE ESTRELLAS (función star) Ejemplo, ÍNDICES BIÓTICOS EN LAS ESTACIONES Aguaflash: read.table ("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) stars (INDAGUAFLASH[,3:6], label=SITE ,cex=0.5, key.loc = c(18, 2.3))

Gráficos Multivariantes GRAFICOS DE ESTRELLAS (función star) Ejemplo, GRUPOS FITOPLANCTON POR TIPOS EMBALSES DEL EBRO: read.table("C:/AMDDATOSR/fitotipos.txt", header=T)->fitotipos attach(fitotipos) stars (fitotipos, label=type ,cex=0.5, draw.segments=TRUE, key.loc=c(8, 2))

Gráficos Multivariantes GRAFICOS DE ESTRELLAS (función star) Ejemplo, GRUPOS FITOPLANCTON POR TIPOS EMBALSES DEL EBRO: read.table("C:/AMDDATOSR/fitotipos.txt", header=T)->fitotipos attach(fitotipos)

Gráficos de Regresión Modelos Lineales Generalizados (funciones: glm, abline, plot) Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) glm (IASPT ~ IVAM)-> model plot (IASPT, IVAM, pch=19) abline (model, col=4, lwd=2) summary (model) Estimate Std. Error t value Pr(>|t|) (Intercept) 1.8479 0.5292 3.492 0.00119 ** IVAM 0.5800 0.1059 5.478 2.56e-06 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Gráficos de Regresión Modelos Lineales Generalizados (funciones: glm, abline, plot) Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) glm (IASPT~IVAM)-> model plot (IASPT, IVAM, pch=19) abline (model, col=4, lwd=2) par(mfrow = c(2,2)) plot (model)

Gráficos de Regresión Modelos Lineales (funciones: glm, lm, abline, plot). Intervalos de confianza. Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) read.table ("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009 attach (emb2009) lm (chla~pt)-> model plot (pt, chla, pch=19, xlab ="P total (µg/L) ", ylab= "Chla (µg/L)") abline (model, col=4, lwd=2) newx <- seq (min(pt), max(pt), 0.01) c <- predict (model, newdata=data.frame (pt=newx), interval="prediction") d <- predict (model, newdata=data.frame (pt=newx), interval="confidence") lines (newx, c[,2], lty=2, col="grey") lines (newx, c[,3], lty=2, col="grey") lines (newx, d[,2], lty=2, col= "red") lines (newx, d[,3], lty=2, col= "red") text (20,30,"Adjsted R-squared: 0.3819")

Gráficos de Clasificación GRAFICOS DE CLUSTERS. DENDROGRAMAS (función agnes_paquete cluster) Ejemplo jerárquico: UPGMA (tipos embalses ~ fitoplancton) read.table("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009; attach(emb2009) agnes ( log (emb2009 [, 43:51]+2), method="average") -> UPGMA plot (UPGMA, main="clasificación UPGMA embalses")

Gráficos de Clasificación GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means (tipos embalses ~ fitoplancton) read.table ("E:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009 attach(emb2009) emb2009 [,43:48] -> algasembalses library (stats) kmeans (algasembalses, 5, iter.max=100) -> kmemb2009 kmemb2009 K-means clustering with 5 clusters of sizes 1, 43, 2, 4, 7 Clustering vector: [1] 2 2 2 2 2 2 2 5 2 3 2 2 2 2 2 2 5 2 2 2 2 4 5 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 [39] 2 4 4 2 2 5 2 2 5 5 2 5 2 2 2 4 2 3 2

Gráficos de Clasificación GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means #Ahora los podemos representar en un plano de ordenación, ej. PCA library (ade4) dudi.pca( log (algasembalses+1), scannf=F, nf=2)-> pca pca data.frame nrow ncol content 1 $tab 57 6 modified array 2 $li 57 2 row coordinates 3 $l1 57 2 row normed scores 4 $co 6 2 column coordinates 5 $c1 6 2 column normed scores plot (pca$li, pch=19, col=kmemb2009$cluster, cex=1.25)

Gráficos de Clasificación GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means as.factor (kmemb2009$cluster)-> kmgr s.class ( pca$li, kmgr, cstar=T, cellipse=T, cpoint=.75, clabel=.6)

Gráficos de Ordenación BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4) data (rpjdl) millog <- log (rpjdl$mil + 1) iv1 <- cca (rpjdl$fau, millog, scan = FALSE) plot(iv1)

Gráficos de Ordenación BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4)

Gráficos de Ordenación BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4)