Taller de R para estadísticas Gráficos en R

Slides:



Advertisements
Presentaciones similares
ANALISIS DE DATOS George Castro Ma. Laura Alvear Eduardo Sandoval INFORMATICA APLICA A NEGOCIOS.
Advertisements

Análisis y previsión de ventas
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
Introducción a la estadística. ¿Qué es la estadística? La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica.
GRAFICOS. Alejandra Mesa Manuela Ruiz 9°A.. Definición: Representación esquemática de los datos de una hoja de calculo, lo cual facilita su interpretación.
ESTADÍSTICA Medidas de Tendencia no Central. Medidas de Tendencia no Central. Medidas de Variabilidad Medidas de Variabilidad.
TEMA 3: Estadística Bidimensional. ● Álvaro Fernández Romero y Luis Carlos Fernández herrezuelo.
DISTRIBUCIÓN NORMAL.
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
Bioestadística Distribuciones muestrales para variables cuantitativas.
UNIVERSIDAD NACIONAL DE INGENIERIA FIEECS-EPIES ANALISIS DE INDICADORES ECONOMICOS PROF: HUAMANCHUMO DE LA CUBA, LUIS.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
Objetivo: Conocer la línea de simetría en diversas figuras.
Ejemplo de frecuencias
GRAFICOS ESTADISTICOS
Tipos de gráficos Sectores Columnas Columnas apiladas Líneas
GRAFICOS ESTADISTICOS
Gráficos Estadísticos
Editor de Planillas de Cálculo Introducción al análisis de gráficos
ESTADISTICA Tema: Grafico de barras
7.1 Procedimientos paramétricos para datos cuantitativos
Statistic Package for Social Sciencies
5ta clase de excel Planilla de calculo.
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
Tutorial presentado por:
ESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA DESCRIPTIVA: OBTENCIÓN Y ORGANIZACIÓN DE LOS DATOS
Realizado por: Ana María Abad Cecilia
Una vez completada esta lección, podrá:
Estadística: conceptos básicos y definiciones.
Metodología de la Investigación
Comparación de medias-no paramétrico
Escuela de Trabajo Social
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
ANALISIS DE DATOS CUANTITATIVOS
Elementos de análisis espacial…2
Universidad Nacional de Canindeyú Facultad de Ciencias de la Salud
MODULO MICROSOFT EXCEL 2013
Presentaciones Graficas Histograma, Grafica de Pastel y Grafica de Barras.
Presentaciones Graficas Histograma, Grafica de Pastel y Grafica de Barras.
Tema 6 Microsoft Excel Parte 11 Lic. Claudia Román.
Tabulación y representación gráfica de datos cualitativos y cuantitativos
UNIVERSIDAD AUTÓNOMA DE CHIRIQUÍ VICERRECTORÍA DE INVESTIGACIÓN Y POSGRADO FACULTAD DE HUMANIDADES - ESCUELA DE EDUCACIÓN FÍSICA MAESTRÍA EN EDUCACIÓN.
Representación gráfica de variables Cualitativas y Cuantitativas en Excel. Tablas dinámicas Carolina Aranda Ortega Doria Lizeth Quintero Ebis Tatiana baron.
ANÁLISIS DE DATOS MAESTRÍA EN RECURSOS HUMANOS. MAPA CONCEPTUAL Análisis de Datos Tipos de datos Arreglo ordenado Distribución de frecuencias Distribución.
Excel Estadístico Medidas de Dispersión.
GRAFICOS ESTADÍSTICOS
GRAFICOS ESTADÍSTICOS
ÁREA VINCULACIÓN CLIENTES ENERGÍA
P.S.P. ALMA JIMENEZ RIVERA
estadistica 6 graficas Gráficas
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
UNIVERSIDAD DE LOS ANDES CENTRO DE INVESTIGACIONES PSICOLÓGICAS
Capítulo 1.4: Distribución de frecuencias unidimensionales Introducción Descripción numérica Representación gráfica.
Presentación de datos e interpretación de resultados.
Medidas centrales Por E. Skerrett.
Estadística social fundamental
Seminario 6. Ejercicio obligatorio tema 5.
SGeMS Stanford Geostatistical Earth Modeling Software Funciones básicas.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
DISTRIBUCION NORMAL. Una de las distribuciones de frecuencia más importantes en la estadística es la distribución normal La distribución de probabilidad.
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
DIAGRAMAS ESTADISTICOS LIC. JOHANA CAROLINA RIVERA ARDILA DOCENTE DEL ÁREA DE ESTADÍSTICA GRADO NOVENO 2019.
Gráficos en Word Es una herramienta con la que puedes exponer datos o cifras de manera gráfica.
Informacion estadistica Para cada tabla ●Cardinalidad (n° de filas) ●Factor de bloques (n° de filas que caben en un bloque) ●N° de bloques ocupados ●Método.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Taller de R para estadísticas Fundamentos del Lenguaje, tipo y estructura de datos Mgter. Danny Murillo.
Presentación de datos e interpretación de resultados.
Menú principal Terminar presentación Ejercicio 5-6 El peso neto (en oz) de un producto blanqueador se va a monitorear con una gráfica de control utilizando.
Transcripción de la presentación:

Taller de R para estadísticas Gráficos en R Mgter. Danny Murillo

Objetivo Mostrar la visualización de los gráficos de dispersión, boxplot, histograma y densidad y la relación entre cada uno de ellos.

Representación gráfica de variables continua Gráfica de dispersión #cargar datos de hospitales #los datos muestran el tiempo de atención en minutos de 11 personas encuestadas por hospital con la idea de conocer cual es el hospital con mayor eficiencia en la atención. hospital1<-data.frame(nombre=c("p1","p2","p3","p4","p5","p6","p7","p8","p9","p10","p11"), valores=c(19,27,20,16,18,35,67,16,8,34,59)) hospital2<-data.frame(nombre=c("p1","p2","p3","p4","p5","p6","p7","p8","p9","p10","p11"), valores=c(1,2,3,4,15,30,67,16,8,75,98)) hospital3<-data.frame(nombre=c("p1","p2","p3","p4","p5","p6","p7","p8","p9","p10","p11"), valores=c(-100,2,3,4,15,30,67,16,8,75,198))

Representación gráfica de variables continua Gráfica de dispersión #calcular valores estadísticos de datos de hospitales #media me1<-median(hospital1$valores) me2<-median(hospital2$valores) me3<-median(hospital3$valores) m1<-mean(hospital1$valores) m2<-mean(hospital2$valores) m3<-mean(hospital3$valores) #desviacion estandar sd1 <- sd(hospital1$valores) sd2 <- sd(hospital2$valores) sd3 <- sd(hospital3$valores)

Representación gráfica de variables continua Gráfica de dispersión #graficar diagramas de dispersión de hospitales # cex=1 , tamaño del punto en el grafico #pch =15 , tipo de punto , figura #xlim = escala del eje x de -45 a 200 #plot del hospital 1 plot(hospital1$valores,hospital1$nombre, main="Hospital 1 \n datos", cex=1, pch=15, col="blue", xlim = c(-45, 200), xlab="tiempo", ylab="observacion") # líneas que interceptan el grafico abline(v=me1, col="black") #mediana abline(v=m1, col="purple") #media abline(v=m1-sd1, col="red") #desviación standar abline(v=m1+sd1, col="red") #desviación standar

Representación gráfica de variables continua Gráfica de dispersión #graficar diagramas de dispersión de hospitales # cex=1 , tamaño del punto en el grafico #pch =15 , tipo de punto , figura #xlim = escala del eje x de -45 a 200 #plot del hospital 2 plot(hospital2$valores,hospital2$nombre, main="Hospital 2 \n datos", cex=1, pch=15, col="blue", xlim = c(-45, 200), xlab="tiempo", ylab="observacion") # líneas que interceptan el grafico abline(v=me2, col="black") #mediana abline(v=m2, col="purple") #media abline(v=m2-sd2, col="red") #desviación standar abline(v=m2+sd2, col="red") #desviación standar

Representación gráfica de variables continua Gráfica de dispersión #graficar diagramas de dispersión de hospitales # cex=1 , tamaño del punto en el grafico #pch =15 , tipo de punto , figura #xlim = escala del eje x de -45 a 200 #plot del hospital 3 plot(hospital3$valores,hospital3$nombre, main="Hospital 3 \n datos", cex=1, pch=15, col="blue", xlim = c(-45, 200), xlab="tiempo", ylab="observacion") # líneas que interceptan el grafico abline(v=me3, col="black") #mediana abline(v=m3, col="purple") #media abline(v=m3-sd3, col="red") #desviación standar abline(v=m3+sd3, col="red") #desviación standar

Representación gráfica de variables continua Unir gráficos de hospitales #cambiar área de impresión del grafico a 3 filas y 3 columnas #utilizando la función par #se debe unificar la escala xlim = c(-45, 200), en todos los gráficos par(mfrow=c(3,1)) #Imprimir nuevamente los gráficos de los tres hospitales #plot del hospital 1 plot(hospital1$valores,hospital1$nombre, main="Hospital 1 \n datos", cex=1, pch=15, col="blue", xlim = c(-45, 200), xlab="tiempo", ylab="observacion") abline(v=me1, col="black") #mediana abline(v=m1, col="purple") #media abline(v=m1-sd1, col="red") #desviación standar abline(v=m1+sd1, col="red") #desviación estándar #plot del hospital 2 plot(hospital2$valores,hospital2$nombre, main="Hospital 2 \n datos", cex=1, pch=15, col="blue", xlim = c(-45, 200), xlab="tiempo", ylab="observacion") abline(v=me2, col="black") #mediana abline(v=m2, col="purple") #media abline(v=m2-sd2, col="red") #desviación standar abline(v=m2+sd2, col="red") #desviación estándar #plot del hospital 3 ……

Representación gráfica de variables continua Unir gráficos de hospitales Al mostrar los tres gráficos de los hospitales vemos que todos los hospitales tienen la misma media de atención m1, m2, m3 aproximadamente el valor de 29 minutos. Osea que la media indica que el promedio de atención es similiar. Sin embargo si analizamos la desviación estándar de cada hospital sd1 = 18, sd2=34, sd3 = 71, el hospital 2 y 3 tiene valores mas dispersos en relación a la media que el hospital 1. Por ende el hospital 1 es según datos, el hospital cuyo tiempo de atención entre un paciente es mejor que el de los otros dos hospitales.

Representación gráfica de variables continua Comparar visualización de los gráficos #cambiar área de impresión del grafico a 4 filas y 3 columnas #utilizando la función par par(mfrow=c(4,1)) #grafico de barras plot(hospital1$valores,hospital1$nombre, main="Hospital 1 \n datos", cex=1, pch=15, col="blue", xlab="tiempo", ylab="observacion", xlim = c(0, 100)) abline(v=me, col="black") abline(v=m1, col="purple") abline(v=m1-sd1, col="red") abline(v=m1+sd1, col="red") #grafico boxplot #boxplot(hospital1$valores,horizontal = TRUE) boxplot(hospital1$valores,horizontal = TRUE, ylim=c(0,100)) #escala en y del gráfico IMPORTANTE #grafico de histograma hist(hospital1$valores, xlim=c(0,100)) #grafico de densidad d<-density(hospital1$valores) plot(d, xlim = c(0, 100))

Representación gráfica de variables continua Comparar visualización de los gráficos #comparación de visualización de los gráficos del hospital 1 # se muestran los datos generados por el boxplot de los valores en $stats de la mediana =20 y el valor atípico 67 en la variable $out boxplot.stats(hospital1$valores) Los gráficos muestran la posición de la media (línea purpura), mediana (línea negra) y desviación estándar de los datos (línea roja). Los datos también muestran una asimetría positiva o mayor cantidad de datos por debajo de la media.

Exportar datos en R #establecer directorio de trabajo donde deseo guardar mi trabajo setwd("C:/Users/UTP/Desktop/APC") #ruta de ubicación en mi computador #la tabla a exportar debe ser un dataFrame #función write.csv write.csv(nombre del data frame, file=“nombre del archivo.csv") Ejemplo write.csv(titanic3,"titanic_depurado.csv") #guardar como archivo de texto write.table(titanic, file=“titanic_depurado.csv") #guardar resumen de datos de dataframe summary(titanic3) resumen<- summary(titanic3) capture.output(resumen, file="resumen.doc")

MUCHAS GRACIAS