Introducción al lenguaje R Sesión 4 / Gráficos en R

Slides:



Advertisements
Presentaciones similares
1 Datos sobre webloggers Datos extraidos de la encuesta a webloggers disponibles en la web de los autores.
Advertisements

el 1, el 4 y el 9 tres cuadrados perfectos autosuficientes
Profesor: Noé Becerra Rodríguez 26 de septiembre 2013
Conocimiento, Uso y Evaluación de Medicamentos Genéricos
Los números del 0 al cero uno dos tres cuatro cinco 6 7 8
1 ESTUDIO DE OPINIÓN PÚBLICA: LA SEXUALIDAD DE LOS CHILENOS ABRIL 2006 ¿Informados o desinformados? Principal fuente de información Las enseñanzas durante.
Noviembre 2007Estudio Rostros de Noticias 2007Collect-GfKWikén Estudio Rostros de Noticias de la TV Chilena Desarrollados para Revista Wikén El Mercurio.
Variables Sherine Shawky, MD, Dr.PH Profesor asistente
RELACIÓN POSTULADOS POR SEXO
1 LA UTILIZACION DE LAS TIC EN LAS MICROEMPRESAS GALLEGAS. AÑO mayo 2005.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS (MICROEMPRESAS, resultados provisionales) 29 de julio de 2004.
CREACIÓN DE PÁGINAS WEB CON SHAREPOINT DESIGNER 2007 (Sesión 2) Ricardo Ferrís Castell ( ) Departament D Informàtica.
TEMA 2 MÚLTIPLOS Y DIVISORES
INTERFERENCIAS y DIFRACCIÓN
02- Plan Organización Docente v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
01- OFERTA FORMATIVA v.2 Noviembre 2009 SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR.
CAPÍTULO 2 Elaboración y utilización de gráficas
Área Razón Social 0 0 Telefónica Servicios Audiovisuales S.A. / Telefónica España S.A. Título de la ponencia / Otros datos de interés / Kit.
Resultado 1.3 con actividad 1.3.1
Modas Página Internet: Correo Electrónico:
MEDIDAS DE TENDENCIA CENTRAL
1-1 Capítulo dos Descripción de los datos: distribuciones de frecuencias y representaciones gráficas OBJETIVOS Al terminar este capítulo podrá: UNO Organizar.
Los Objetos de la Clase Escriban la palabra (the word) en español para los objetos de la clase (#1-20).
NUMBERS
Unidad de competencia II Estadística descriptiva: Métodos gráficos
Unidad de competencia II Estadística descriptiva:
Objetivos: Al terminar este capítulo podrá:
72 54 Los Números
Estructura Económica de México Prof. Abelardo Mariña Flores trimestre 2010-P.
¿CUÁNTAS BOTELLAS DE UNTERCIO DE LITRO PUEDES LLENAR CON SEIS LITROS?
William Shakespeare ( greg.), fue un dramaturgo, poeta y actor inglés. Conocido en ocasiones como el Bardo de Avon (o.
DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA5 Libertad y Orden DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA CENSO GENERAL 2005 REPÚBLICA.
PRUEBA DE APTITUD ACADÉMICA
TELEFONÍA IP.
Vocabulario querer comerlo -paja por supuesto - madera
Sistemas de Ecuaciones
En 2010, en Baja California somos habitantes: 50.4% 49.6%
FUNCIONES DE UNA VARIABLE REAL
Proyecto para Centros que trabajan una vez por semana.
Indicadores CNEP Escuela
Profr. Ricardo A. Castro Rico
CAPÍTULO 2 Elaboración y utilización de gráficas
¡Primero mira fijo a la bruja!
Gráficas Enfoque en los números 1.
M.C. Victor M. Cortez Sanchez
MINIMO COMÚN MÚLTIPLO DE DOS NÚMEROS a y b
1. Datos prensa. Fuente: ACEM
CULENDARIO 2007 Para los Patanes.
BEATRIZ LAFONT VILLODRE
* Fuente: Sondeo del Consumidor de la Comisión de la UE, GfK. Expectativas sobre la situación.
Funciones: Conceptos Básicos
By: Nicholas, Rayna, Nathaniel, Calvin
Introducción al lenguaje R Sesión 2: Objetos en R
Los números. Del 0 al 100.
Evaluación Inicia Presentación de Resultados 2012 Santiago, agosto de 2013.
1 ESTUDIO DE SEGUIMIENTO TITULADOS DE LICEOS DE LA CORPORACIÓN EDUCACIONAL DE LA CONSTRUCCIÓN. PROMOCION TITULADOS EL AÑO 2006 Liceo Oscar Corona Barahona.
LOS NÚMEROS.
Vocabulario: (Los números)
uno cero dos seis siete nueve Los Números DIEZ cinco ocho tres
Los Numeros.
Diagrama CAUSA_EFECTO ó ISHIKAWA ó ESPINA DE PESCADO
1 8 de febrero del Chapter 5 Encoding 3 Figure 5-1 Different Conversion Schemes.
ESTUDIO DE OPINIÓN SOBRE UNA REFORMA CONSTITUCIONAL EN ESPAÑA DICIEMBRE 2007.
LA RECTA Y SUS ECUACIONES
Elementos usados para el control temporal del tráfico Módulo 3 1 Este material fue producido con el subsidio Susan B. Harwood No. SH F-48.
Herramienta FRAX Expositor: Boris Inturias.
Estadística Administrativa I
Transcripción de la presentación:

Introducción al lenguaje R Sesión 4 / Gráficos en R Profesor: Noé Becerra Rodríguez 25 de junio 2014

Contenido plot ( ) barplot ( ) hist ( ) boxplot ( ) pie ( ) accesorios para gráficos

Gráficas en R - plot( ) Pueden ser usadas para diagramas de dispersión de dos dimensiones (X, Y) Toma dos vectores como datos de entrada x = c(2,4,6,8,10) y = c(1.5,3,7,8,15) plot(y ~ x) plot(y, x) # es equivalente al anterior

Argumentos básicos - plot( ) col = “ ”: color del gráfico pch: tipo de punto (círculo, cuadrado, círculo relleno, etc.) cex: tamaño de la figura (pch) usada en el gráfico type = “ ”: tipo de gráfico (puntos, líneas, etc.) main = “ ”: título del gráfico sub = “ ”: subtítulo del gráfico xlab, ylab = “ ”: etiquetas de los ejes X / Y xlim, ylim = c( mínimo, máximo): rango de los ejes X / Y col.axis, col.lab, col.main, col.sub: colores para los elementos individuales del gráfico

Opciones para pch

Algunos colores disponibles en R colors( ) # muestra todos los colores disponibles en R # Colores básicos en R

Base “datos” para las gráficas ingreso = c(1,4,2,3,2,3,4,3,2,2,3,1,2,2,2) fingreso = factor (ingreso, levels=1:4, labels= c ("bajo", "medio", "alto", "muy-alto")) género = c(2,1,1,2,2,2,1,2,1,1,2,2,1,1,2) fgénero = factor(género, levels=1:2, labels = c("mujer", "hombre")) peso = c(60, 72, 57, 90, 95, 72, 65, 76, 61, 92, 98, 77, 66, 75, 59) altura = c(1.75, 1.80, 1.65, 1.90, 1.74, 1.91, 1.77, 1.83, 1.69, 1.95, 1.78, 1.88,1.73, 1.79, 1.61) datos = data.frame (peso, altura, fgénero, fingreso) datos

Ejemplo de gráficos - plot( ) names(datos) head(datos) ls.str(datos) plot(peso, altura) plot(datos$peso, datos$altura) plot(datos$peso, datos$altura, col="blue", pch=19) plot(datos$peso, datos$altura, col="blue", pch=19, type="p", main="Diagrama de dispersión peso vs altura")

Ejemplos - plot( ) plot(datos$peso, datos$altura, col=“blue”, pch=19, type="p", main="Diagrama de dispersión peso vs altura", sub = "muestra número 1", xlab="peso", ylab="altura") sub = "muestra número 1", xlab="peso", ylab="altura", xlim = c(55,100), ylim = c(1.55,2))

¿preguntas?

Gráficos en R - barplot( ) Genera una gráfica de barras para datos tipo factor Las opciones más comunes que se manejan son: names.arg: etiquetas de las barras, por defecto los toma de la base horiz: hacer la barras horizontales (TRUE/FALSE) main, xlim, xlab ... Argumentos similares al plot ( )

Ejemplos - barplot( ) 1variable ? conteo=table(datos$fingreso) barplot(conteo) barplot(conteo, main="Gráfica de barras del ingreso") barplot (conteo, main="Gráfica de barras del ingreso", xlab = "categoría de ingreso", ylab = "cant. individuos") barplot(conteo, main="Gráfica de barras del ingreso", xlab="categoría de ingreso", ylab="cant. de individuos", col="green") xlab="cant. de individuos", ylab="categoría de ingreso", col="green", horiz=T) Dar zoom a las últimas gráficas

Ejemplos - barplot( ) 2 variables contador = table(datos$fingreso, datos$fgénero) barplot(contador) barplot(contador, main="Gráfico de barras ingreso y género") barplot(contador, main="Gráfico de barras ingreso y género", xlab="género", ylab=“cant. de individuos", col=c("red", "blue", "green", "gray"))

Ejemplos - barplot( ) 2 variables barplot(contador, main="Gráfico de barras ingreso y género", xlab="género", ylab=“cant. de individuos", border="white", col=c("red", "blue", "green", "gray"), legend=rownames(contador)) xlab=“cantidad de individuos", ylab="género", horiz=T, col=c("red", "blue", "green", "gray"), legend=rownames(contador))

¿preguntas?

Gráficas en R - hist( ) La función hist () genera histogramas, la variable debe ser númerica Los argumentos más comunes son: breaks: especifica el número de intervalos main, xlim, xlab etc. funcionan como en la gráfica plot( )

Gráficas en R - hist( ) data(airquality); head(airquality) hist(airquality$Ozone, breaks="Sturges") hist(airquality$Ozone, breaks="Sturges", col="limegreen", main="Histograma sobre Ozono") hist(airquality$Ozone, breaks="Sturges", col="limegreen", main="Histograma sobre Ozono", border="gray40", xlab="cantidad de Ozono", ylab="frecuencia") hist(airquality$Ozone, breaks="Sturges", col="limegreen", col.sub="gray60", main="Histograma sobre Ozono", border="gray40", sub="Datos: airquality", xlab="cantidad de Ozono", ylab="frecuencia")

Gráficas en R - hist( ) hist(airquality$Ozone, breaks="Sturges", col="limegreen", col.sub="gray60", main="Histograma sobre Ozono", border="gray60", sub="Datos: airquality", xlab="cantidad de Ozono", ylab="frecuencia")

¿preguntas?

Gráficas en R – boxplot( ) Las gráficas de boxplot ( ) pueden ser creadas para variables individuales o para un grupo de variables. Los argumentos principales son: X~Y : fórmula que indica las variables a graficar data =: indica el dataframe de donde tomar los datos varwidth = TRUE: gráfica proporcionalmente las cajas horiz = TRUE: para invertir la orientación de los ejes outline = TRUE: muestra los ouliers main, xlabel, etc. Funcional igual que la función plot( )

Gráficas en R - boxplot( ) 1 variable # Boxplot para una sola variable data(cars) names(mtcars) boxplot(mtcars$mpg, col="gray", main="Diagrama de caja, millas por galón", col.sub="gray40", sub="Datos de 1984")

Gráficas en R - boxplot( ) 2 variables boxplot(mtcars$mpg ~ mtcars$cyl) boxplot(mtcars$mpg ~ mtcars$cyl, col="green", main="Gráficos de cajas mpg / cilindros") boxplot(mtcars$mpg ~ mtcars$cyl, col="green", main="Gráficos de cajas mpg / cilindros", xlab="número de cilindros", ylab="millas por galón") boxplot(mtcars$mpg ~ mtcars$cyl, col=rainbow(3), main="Gráficos de cajas mpg / cilindros", xlab="número de cilindros", ylab="millas por galón", col.sub="gray40", sub="Datos 1974 Motor Trend US")

Gráficas en R - boxplot( ) 2 variables boxplot(mtcars$mpg ~ mtcars$cyl, col=2:4, main="Gráficos de cajas mpg / cilindros", xlab="número de cilindros", ylab="millas por galón", col.sub="gray40", sub="Datos 1974 Motor Trend US", varwidth=T) boxplot(mtcars$mpg ~ mtcars$cyl, col=c("green", "gray", "blue"), main="Gráficos de cajas mpg / cilindros", xlab="millas por galón", ylab="número de cilindros", col.sub="gray40", sub="Datos 1974 Motor Trend US", varwidth=T, horizontal=T)

¿preguntas?

Gráficas en R - Pie Las gráficas de pastel no son muy recomendables ya que es más fácil percibir la longitud que el volumen Las opciones de pie( ) incluyen x: vector indicando el área de cada sección labels: vector de cadena para los nombres de las secciones radius: determina el radio del círculo (0.1 a 1) main, col, etc. se apican igual que en la función plot( )

Ejemplos en R - pie( ) Gráficos de Pastel simple datos=c(10,12,4,16,8) etiquetas=c("Italia", "Inglaterra", "Australia", "Alemania", "Francia") pie(datos, etiquetas, main="Gráfico de pastel, PIB Países varios") pie(datos, etiquetas, main="Gráfico de pastel, PIB Países varios", col=rainbow(5), radius=1)

Ejemplos en R - pie( ) Gráfica de pastel con porcentajes datos = c(10, 12, 4, 16, 8) etiqueta = c("EU", "GB", "Australia", "Alemania", "Francia") pc = round(datos/sum(datos)*100) etiqueta = paste(etiqueta, pc) etiqueta = paste(etiqueta,"%",sep=" ") pie(datos,labels = etiqueta, col=rainbow(5), main="Gráfica de pastel, PIB varios países", radius=1)

¿preguntas?

Accesorios para gráficas – par( ) par(mfrow=c(x,y) modifica el área de gráficos para incluir varios elementos en una pantalla, x indica número de renglones mientras que y son las columnas par(mfrow=c(1,2)) boxplot(airquality$Ozone~airquality$Month, col=2:6, main="boxplot ozono por mes") plot(airquality$Ozone, airquality$Wind, col="blue", pch=19, cex=0.75, main="Gráfico ozono vs viento") par(mfrow=c(1,1)

Accesorios para gráficas – abline( ) abline(x) dibuja una línea horizontal (h) o vertical (v) sobre el gráfico. Acepta otros argumentos que impliquen una línea recta. par(mfrow=c(1,2)) plot(airquality$Ozone, airquality$Wind, col="blue", pch=19, main="ozono vs viento", xlab="", ylab="", cex=0.75) abline(h=10, col="red", lwd=2.5) plot(airquality$Ozone, airquality$Temp, col="red", pch=19, main="zono vs temperatura", xlab="", ylab="", cex=0.75) abline(v=55, col="blue", lwd=2.5)

Accesorios para gráficas – text( ) text (x,y, “texto de gráfica”) permite incluir texto en las gráficas. X e Y son las coordenadas para ubicar la leyenda par(mfrow=c(1,1,)) plot(cars$speed, cars$dist, col="blue", pch=17, xlab="velocidad", ylab="distancia", main="distancia de frenado") text(8,80, "datos de 1920")

Accesorios para gráficas – lines( ) El commando lines( ) permite dibujar líneas en el gráfico que no son necesariamente rectas y permite otros argumentos de objetos generados en R cien=rnorm(1000) hist(cien, col=3, freq=F, main=“histograma cien aleatorios”) lines(density(cien), col=2, lwd=2)

Accesorios para gráficas – legend( ) La función legend ( ) permite incorporar textos en los gráficos de manera más flexible que el comando text () set.seed(123) edad = (rnorm (100, 26, 2.5)) ; exam = floor ( rnorm (100, 7, 1.25)) gen = c(rep (1, 55), rep ( 2, 45)); fgen = factor(gen, levels=1:2, labels=c("mujer", "varón")) data = data.frame(edad, exam, fgen) plot (data$edad, data$exam, col=data$fgen, pch=19, cex=0.5) legend(20,10, legend=c("mujer", "varón"), col=c("black", "red"), pch=c(19), cex=c(0.75))

¿preguntas?

Tarea Con la información de la base “babies” que se encuentra en el paquete “UsingR”, generar dos gráficos de cada tipo que se revisaron en la sesión Es necesario bajar el paquete “UsingR” y cargarlo en memoria antes de poder acceder a la base “babies” Las variables a usar son: sex – sexo del infante wt – peso al nacer race – raza del madre age – edad de la madre ed – nivel educativo de la madre inc – ingreso familiar smoke – si fuma o no la madre

¿preguntas? Gracias! berono@hotmail.com http://nbecerrastatistics.wordpress.com/