La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Gráficos en R Seminario CEH-CEDEX 21-22 Febrero, 2011.

Presentaciones similares


Presentación del tema: "Gráficos en R Seminario CEH-CEDEX 21-22 Febrero, 2011."— Transcripción de la presentación:

1 Gráficos en R Seminario CEH-CEDEX Febrero, 2011

2 1. Simplificar lo tedioso y lo complejo. 2. Ayuda visual. Concordante con los ojos. 3. Más accesible que una tabla. 4. Permite entender y memorizar mejor. (William Playfair, pionero de la estadística gráfica) ¿Porqué los gráficos?

3 ¿Cuándo utilizar gráficos? Datos < 20, presentar en una tabla. Si hay que aclarar un gráfico con números, utilizar tabla. Pero algunos autores discuten que la apariencia es importante… Tufte presenta un índice para medir la cantidad de información irrelevante en un gráfico: O el % de tinta del gráfico que puede ser borrado sin afectar los datos

4 ¿Qué hay que pedir a un gráfico? Entendibilidad 1. ¿Permite el gráfico visualizar las relaciones entre las variables? 2. ¿Interactúan los elementos (color, tamaño…) en el gráfico para maximizar nuestra percepción de las relaciones entre las variables? Claridad 1. ¿Son los elementos del gráfico claramente distinguibles? 2. ¿Son los elementos más importantes del gráfico visualmente prominentes? Consistencia 1. ¿Son los elementos de los gráficos consistentes en gráficos anteriores? 2. ¿Hay nuevos elementos que requieren una descripción adicional?

5 Eficiencia 1. ¿los elementos del gráfico representan eficientemente los datos? 2. ¿Hay elementos en el gráfico que sirven a más de un propósito? Necesidad 1.¿Es el gráfico útil para representar estos datos? 2.¿Es cada elemento en el gráfico necesario? Confiabilidad 1. ¿Están los datos adecuadamente colocados en la región de datos? 2. ¿Están los datos representados adecuadamente por la escala? ¿Qué hay que pedir a un gráfico?

6 Un gráfico no distorsiona si la representación visual de los datos es consistente con la representación numérica Intrusión de diseñadores artísticos, tienden a llenar los gráficos de elementos decorativos e inútiles que distraen, ya que piensan que los datos son aburridos. Esto ocurre en periódicos y revistas del kiosco. Gráficos tendenciosos. Ver en televisión, dependiendo del canal (elección de colores llamativos, posiciones relevantes, formas diferentes...) Gráficos distorsionados

7

8

9 ¡¡cuidado con los gráficos que se nos presentan!!! Leer bien las escalas y las variables presentadas.

10 Gráficos circulares (Pie Charts) Común entre personas no profesionales en estadística Si en muchas de las situaciones donde se usan se suprimieran se ahorrarían muchas hojas de papel. A veces se presenta un gráfico de pastel para mostrar que en una muestra el 50% son hombres y el 50% mujeres (?!?!?!?)

11 Gráficos circulares (pie charts) read.table("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009; attach(emb2009) table (tipo) = tipotable pie (tipotable, col=c(1:8), main= " Tipos Embalses")

12 Gráficos de barras tN <- table(Ni <- stats::rpois(10000, lambda=5)) r <- barplot (tN, col=rainbow(20)) lines (r, tN, type='h', col='red', lwd=2)

13 Boxplot o Caja de Tukey read.table("C:/ AMDDATOSR/ INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) boxplot ( IBMWP ~ cuenca, col=c("yellow","blue", "green","red" ))

14 Boxplots o Cajas de Tukey Podemos añadir más modificaciones: boxplot ( IBMWP ~ cuenca, col=c("yellow","blue", "green","red" ), notch = TRUE, main = "IBMWP por cuencas", ylab="IBMWP", xlab="cuenca", varwidth=T)

15 Histogramas # Generamos 100 datos aleatorios de una Chi 2 x <- rchisq(100, df = 4) hist(x, freq = FALSE, nclass=9, ylim = c(0, 0.2),col=4)

16 Histogramas #Comparemos con la funcion de probabilidad Chi 2 curve (dchisq (x, df = 4), col = 2, lty = 2, lwd = 2, add = TRUE)

17 Histogramas hist (area, breaks = 15, ylab="nº embalses", xlab="superficie (Ha)", main="histograma de superficie de embalses", label=T, col=(palette(gray(1-seq(0,1,len=8))))) read.table("C:/AMDDATOSR/embalses2008.txt", header=T)-> emb2008; attach(emb2008)

18 Diagramas de densidad de Kernel density (IBMWP) -> densibmwp plot (densibmwp, main= "D ensidad índice IBMWP ", xlab= " IBMWP ", ylab= " densidad",xlim=c(0,300)) polygon (densibmwp, col=1)

19 Representando 2 variables #EJEMPLO: DISPERSIÓN read.table ("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) head (INDAGUAFLASH) cuenca SITE IVAM NFAM IBMWP IASPT 1 ALEGRIA ALE ALEGRIA ALE ALEGRIA ALE-5b ALEGRIA ALE ALEGRIA ALE ALEGRIA ALE-15b plot (INDAGUAFLASH[,3:6], col=3, pch=19)

20 Representando 2 variables #EJEMPLO: DISPERSIÓN read.table ("C:/ AMDDATOSR/ INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach (INDAGUAFLASH) head (INDAGUAFLASH) cuenca SITE IVAM NFAM IBMWP IASPT 1 ALEGRIA ALE ALEGRIA ALE ALEGRIA ALE-5b ALEGRIA ALE ALEGRIA ALE ALEGRIA ALE-15b plot (INDAGUAFLASH[,3:6], col=cuenca, pch=19)

21 Representando 2 variables #EJEMPLO: SEN(X) #Preparamos los datos, un vector x (secuencia de 41 elementos de 1 a 2pi) #y otro vector y = seno(x) x <- seq ( from=1, to=2*pi, length=41 ) y <- sin(x) plot (x, y, col="red", cex=2) curve (sin, add=T, lwd=2)

22 Representando 2 variables Ciclos de atributos de símbolos: 3 colores (col) y 3 tamaños (cex): color <- c("red", "blue", "green") plot (x, y, col=color, cex=1:3, lwd=4, ylim = c(-1,1.5)) lines (x,y, lwd=2)

23 Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL read.table("C:/AMDDATOSR/R perfiles embalses2009.txt", header=T)- >perf2009 attach(perf2009) #Dividimos nuestra matriz por el factor código de embalse, COD, split (perf2009,COD)-> perf2009 attach(perf2009$BUB) head(perf2009$BUB) COD DEP COND DO Temp pH 126 BUB BUB BUB BUB BUB BUB

24 Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL Ejemplo, perfil de temperatura: plot (Temp, DEP, type="o", col = "red", main= "Embalse de Búbal", cex.main=.8, pch = 20, cex = 1, ylab="profundidad (m)", xlab="temperarura (ºC)", font=1, cex.axis=.7, cex.lab=.8, lwd=.7, col.axis="black", ylim=c(53,0), mgp=c(1.5,.6, 0)) axis ( 3, cex.axis=.7, tck=-.03, mgp=c(1.5,.6,0)) #savePlot ("BUBtemp",type = "emf")

25 Representando 2 variables EJEMPLO GRAFICOS PERFILES PROFUNDIDAD:EMBALSE DE BÚBAL Ejemplo, perfil de temperatura:

26 Gráficos tridimensionales EJEMPLO: Visualizar un MDT # (3) Visualizing a simple DEM model z <- 2 * volcano x <- 10 * (1:nrow(z)) y <- 10 * (1:ncol(z)) persp (x, y, z, theta = 135, phi = 30, col = "green3", scale = FALSE, ltheta = - 120, shade = 0.75, border = NA, box = FALSE)

27 Gráficos tridimensionales EJEMPLO:

28 Gráficos Multivariantes GRAFICOS DE ESTRELLAS (función star) Ejemplo, ÍNDICES BIÓTICOS EN LAS ESTACIONES Aguaflash: read.table ("C:/AMDDATOSR/INDAGUAFLASH.txt", header=T)-> INDAGUAFLASH attach(INDAGUAFLASH) stars (INDAGUAFLASH[,3:6], label=SITE,cex=0.5, key.loc = c(18, 2.3))

29 GRAFICOS DE ESTRELLAS (función star) Ejemplo, GRUPOS FITOPLANCTON POR TIPOS EMBALSES DEL EBRO: stars (fitotipos, label=type,cex=0.5, draw.segments=TRUE, key.loc=c(8, 2)) read.table("C:/AMDDATOSR/fitotipos.txt", header=T)->fitotipos attach(fitotipos) Gráficos Multivariantes

30 GRAFICOS DE ESTRELLAS (función star) Ejemplo, GRUPOS FITOPLANCTON POR TIPOS EMBALSES DEL EBRO: read.table("C:/AMDDATOSR/fitotipos.txt", header=T)->fitotipos attach(fitotipos) Gráficos Multivariantes

31 Modelos Lineales Generalizados (funciones: glm, abline, plot) Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) Gráficos de Regresión glm (IASPT ~ IVAM)-> model plot (IASPT, IVAM, pch=19) abline (model, col=4, lwd=2) summary (model) Estimate Std. Error t value Pr(>|t|) (Intercept) ** IVAM e-06 *** --- Signif. codes: 0 *** ** 0.01 *

32 Modelos Lineales Generalizados (funciones: glm, abline, plot) Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) Gráficos de Regresión glm (IASPT~IVAM)-> model plot (IASPT, IVAM, pch=19) abline (model, col=4, lwd=2) par(mfrow = c(2,2)) plot (model)

33 Modelos Lineales (funciones: glm, lm, abline, plot). Intervalos de confianza. Ejemplo: IASPT ~ IVAM (datos INDAGUAFLASH) read.table ("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009 attach (emb2009) Gráficos de Regresión lm (chla~pt)-> model plot (pt, chla, pch=19, xlab ="P total (µg/L) ", ylab= "Chla (µg/L)") abline (model, col=4, lwd=2) newx <- seq (min(pt), max(pt), 0.01) c <- predict (model, newdata=data.frame (pt=newx), interval="prediction") d <- predict (model, newdata=data.frame (pt=newx), interval="confidence") lines (newx, c[,2], lty=2, col="grey") lines (newx, c[,3], lty=2, col="grey") lines (newx, d[,2], lty=2, col= "red") lines (newx, d[,3], lty=2, col= "red") text (20,30,"Adjsted R-squared: ")

34 GRAFICOS DE CLUSTERS. DENDROGRAMAS (función agnes_paquete cluster) Ejemplo jerárquico: UPGMA (tipos embalses ~ fitoplancton) Gráficos de Clasificación read.table("C:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009; attach(emb2009) agnes ( log (emb2009 [, 43:51]+2), method="average") -> UPGMA plot (UPGMA, main="clasificación UPGMA embalses")

35 GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means (tipos embalses ~ fitoplancton) Gráficos de Clasificación read.table ("E:/AMDDATOSR/embalses2009.txt", header=T)-> emb2009 attach(emb2009) emb2009 [,43:48] -> algasembalses library (stats) kmeans (algasembalses, 5, iter.max=100) -> kmemb2009 kmemb2009 K-means clustering with 5 clusters of sizes 1, 43, 2, 4, 7 Clustering vector: [1] [39]

36 Gráficos de Clasificación #Ahora los podemos representar en un plano de ordenación, ej. PCA library (ade4) dudi.pca( log (algasembalses+1), scannf=F, nf=2)-> pca pca data.frame nrow ncol content 1 $tab 57 6 modified array 2 $li 57 2 row coordinates 3 $l row normed scores 4 $co 6 2 column coordinates 5 $c1 6 2 column normed scores plot (pca$li, pch=19, col=kmemb2009$cluster, cex=1.25) GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means

37 Gráficos de Clasificación GRAFICOS DE CLUSTERS Ejemplo no jerárquico: K-Means as.factor (kmemb2009$cluster)-> kmgr s.class ( pca$li, kmgr, cstar=T, cellipse=T, cpoint=.75, clabel=.6)

38 BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4) Gráficos de Ordenación data (rpjdl) millog <- log (rpjdl$mil + 1) iv1 <- cca (rpjdl$fau, millog, scan = FALSE) plot(iv1)

39 BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4) Gráficos de Ordenación

40 BIPLOTS DE ORDENACIÓN (ej. CCA: Análisis Canónico de Correspondencias) función cca_paquete ADE4) Gráficos de Ordenación

41


Descargar ppt "Gráficos en R Seminario CEH-CEDEX 21-22 Febrero, 2011."

Presentaciones similares


Anuncios Google