Qué es una Variable Aleatoria??????????

Slides:



Advertisements
Presentaciones similares
ESTADÍSTICA DESCRIPTIVA
Advertisements

Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4: Medidas de dispersión
Capítulo 3: Medidas de posición
Medidas de tendencia central y de variabilidad
Rango y Rango intercuartil
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión Estadística E.S.O.
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
Estadística descriptiva
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Introducción a la estadística
REPASO BLOQUE I: TEMAS 1-4
Estadística Descriptiva
Estadística Descriptiva continuación
DISTRIBUCIÓN NORMAL La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas,
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Tema 2: Parámetros Estadísticos
Medidas de resumen.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Fundamentos Matemáticos Medidas de tendencia central
Laboratorio de Estadística administrativa
Medidas de Posición y Centralización Estadística E.S.O.
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
MEDIDAS DE VALOR CENTRAL
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Estadística 1. Recuento de datos. Tablas de frecuencias
ESTADISTICA PARA RELACIONES LABORALES
2.2: Resumen numérico Medidas de localización. Medidas de dispersión.
Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Describir una variable numérica
Page 1 Page 2 Asimetría Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética).
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Estadística Aplicada a la Sesión 04: Medidas de Posición
LA ESTADÍSTICA.
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
ESTADÍSTICA DESCRIPTIVA
PARÁMETROS ESTADÍSTICOS
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTADÍSTICA UNIDIMENSIONAL
MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central
Características de las distribuciones estadísticas
Objetivo: Recordar elementos presentes en el estudio de la estadística
Elementos para el análisis estadístico
10. Estimación puntual e intervalos de confianza Módulo II: Análisis descriptivo univariado Análisis de Datos Aplicado a la Investigación Científica
Coeficiente de variación
DIPLOMADO DE POSTGRADO
Estadística descriptiva
Medidas de posición y dispersión IV medio
Estadística y probabilidad aplicada a los negocios
PROBABILIDAD Y ESTADISTICA.
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
Medidas de tendencia central
Medidas num é ricas descriptivas Estad í stica Capítulo 3.1.
MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE TENDENCIA CENTRAL Prof. Lygia Andrea Mejía Maldonado.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
Transcripción de la presentación:

Qué es una Variable Aleatoria?????????? Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar. La ley que asocia a cada hombre con su talla es una variable aleatoria (continua). A esta función que asocia a cada deportista con su talla la llamaremos variable aleatoria y la denotaremos por X. 184.2 191.8 188.0 196.2 178.4 .... etc X: Talla

Ejemplo X: Talla 184.2 191.8 188.0 196.2 178.4 184.2 195.4 189.2 186.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5 184.2 193.5 195.6 186.3

Cómo ordenamos los datos??????????? En una: Tabla de Distribución de Frecuencia Qué es ????? Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (nº de veces que aparece cada valor de la variable en la muestra).

Distribución de frecuencia de ejemplo (TALLA) Tabla de frecuencias Talla 173.5-179.5 179.5-185.5 185.5-191.5 191.5-197.5 197.5-203.5 f 2 4 7 6 1 20 F 2 6 13 19 20 =

Distribución de frecuencia de ejemplo (TALLA) Histograma

Medidas de Resumen Los fenómenos biológicos no suelen ser constantes Necesitamos conocer: La tendencia central de los datos La dispersión o variación respecto de este centro Los datos que ocupan ciertas posiciones La simetría de los datos La forma en que los datos se agrupan

Medidas representativas de un conjunto de datos estadísticos

Medidas de Tendencia Central Son medidas alrededor de las cuales se concentran los datos Las tres medidas más usuales de tendencia central son: Media Mediana Moda

1.-Media Aritmética (X) de una variable aleatoria (o Promedio) Es la suma de todos sus posibles valores dividida por el n° total de datos (n) (Ejemplo: TALLA) Datos: 184.2 191.8 188.0 196.2 178.4 184.2 195.4 189.2 186.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5 184.2 193.5 195.6 186.3

2.- Mediana(Med) de una variable aleatoria Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 % de las observaciones. Primero !!!!! Ordenamos los valores de menor a mayor Si n es el número de observaciones: a) n impar: mediana es el único valor central b) n par: mediana es el promedio de los dos valores centrales

Si la variable es la talla

(Ejemplo: TALLA) Datos ordenados: n= 20 par 10 datos 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 10 datos n= 20 par Mediana Promedio de 2 valores centrales Dejan aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)

(Ejemplo: PESO) Med=58 Datos ordenados: 39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72 n= 21 impar Med=58 Mediana valor central único Deja aproximadamente 50% de los datos bajo y sobre sí (aprox. 10 datos)

Sea X una variable discreta con los siguientes valores: Mediana= (5+7)/2= 6 Media= (2+5+7+12)/4=6.5 Si cambiamos la última observación por otra extrañamente grande X: 2, 5, 7, 125 (2+5+7+125)/4=34.75 Media= Mediana= (5+7)/2= 6 Conclusión: La Media es afectada por valores extremos, no así, la Mediana

Ejercicio Cuál de los dos valores es más adecuado para la distribución de los datos, la Media o la Mediana??? Límite real f 0-10 60 10-20 80 20-30 30 30-100 20 100-500 10 200 c 5 15 25 65 300 F 60 140 170 190 200

La medida de tendencia central más adecuada para describir estos datos es la MEDIANA

3.- Moda de una variable aleatoria Es aquel valor de la variable con mayor frecuencia absoluta. Puede no ser única

(Ejemplo: TALLA) Como conocemos cada uno de los datos, podemos ver el que más se repite: Moda= 184.2

Medidas de Posición Dividen el conjunto de datos ordenados en partes iguales Las dos medidas de posición más usuales son: Percentiles Cuartiles

1.-Percentiles Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de sí el 67% de las observaciones, y por encima queda el 33% PERCENTIL DE ORDEN k: Es la observación, Pk, que deja por debajo de sí el k% de la población. P25 Deja debajo de sí el 25% de los datos ordenados P50 Deja debajo de sí el 50% de los datos ordenados Mediana P75= Deja debajo de sí el 75% de los datos ordenados

1º) Primero ordenamos las observaciones de menor a mayor Si n es el número de observaciones: 1º) Primero ordenamos las observaciones de menor a mayor 2º) Calculamos el k% de n 3º)Contando los datos desde el valor menor al mayor, el percentil de orden k será aquel valor de la variable ubicado en la posición número:

(Ejemplo: TALLA) Datos ordenados: Calculemos el percentil de orden 67% 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 P67 Deja aproximadamente 67% de los datos bajo de sí (aprox. 13 datos), y el 33% sobre sí

2.-Cuartiles Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales P25 Primer cuartil (Q1) Segundo cuartil (Q2) P50=Mediana P75 Tercer cuartil (Q3)

Medidas de Dispersión Cuantifican la separación o la variabilidad de los valores de la distribución respecto al valor central. Nos dicen hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Las más usadas son: Rango(Recorrido) Desviación Estándard

1.-Rango o Recorrido RANGO (RECORRIDO) = Valor Máximo - Valor Mínimo. Inconvenientes del RANGO (RECORRIDO): No utiliza todas las observaciones (sólo dos de ellas). Se puede ver muy afectado por alguna observación extrema. El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso, nunca disminuye.

(Ejemplo: TALLA) Valor Mínimo= 176.5 Valor Máximo= 198.1 176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1 Valor Mínimo= 176.5 Valor Máximo= 198.1 Rango o Recorrido= 198.1 – 176.5= 21.6 Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)

Concentración de plomo (µmol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1 (Ejercicio: Concentración urinaria de plomo en niños Concentración de plomo (µmol/24hr) 0.2 1.5 0.6 2.0 0.8 2.1 (x-promedio) 0.2 - 1.2= -1 1.5 - 1.2=0.3 0.6 - 1.2= -0.6 2.0 - 1.2=0.8 0.8 - 1.2=-0.4 2.1 - 1.2=0.9

solución S2=

2.-Varianza (S2) y desviación estándar(S) Es la media de las diferencias cuadrática de n puntua- ciones con respecto a su media aritmética. Desviación Estándar (S):

(Ejemplo: TALLA) Datos: 184.2 191.8 188.0 196.2 178.4 184.2 191.8 188.0 196.2 178.4 184.2 195.4 189.2 186.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5 184.2 193.5 195.6 186.3

En SPSS

Medidas de Forma 1.- Asimetría Coef. de Coef. de Asimetría =0

Ejemplo Moda <Mediana<Media

En SPSS Si bien se nota una leve cola hacia la Moda <MedianaMedia izquierda, la asimetría es sutil por ello que los valores son cercanos Moda <MedianaMedia

2.- Apuntamiento o curtosis Distribución mesocúrtica : presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica : presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

En SPSS

En SPSS

Ejercicio Datos I: Promedio= 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Mediana= 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5 Datos II: Promedio= Mediana= 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6 Datos III: Promedio= Mediana= 2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6 Datos IV: 3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5 Promedio= Mediana=

Datos x Med Moda Rango P25 P75 P75-P25 S I 4 5 3 2 1 II III IV 3 y 5

+ + + Importante para describir los datos!!!!!!!!!!!!...... Medidas de Tendencia Central + Medidas de Dispersión + Medidas de posición + Gráficos:Histograma, BoxPlot

RESUMEN : Medidas descriptivas Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos . Percentiles, cuartiles Centralización Indican valores respecto alos cuales los datos parecen agrupares . Media, mediana y moda Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización . Varianza, desviación estándar, rango o recorrido Forma Asimetría y apuntamiento

Elección de medidas de tendencia central y de dispersión Variable Nominal Moda Moda Variable Ordinal Mediana Percentiles Variable Contínua: Mediana Con distribución desconocida o asimétrica Percentiles Con distribución simétrica y unimodal (Ej: Normal) Media Desviación estándard