Tema. 5. Variabilidad. Concepto

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Tema 4: Medidas de posición individual.
Tema 3: Caracterización de grupos
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Tema 7. Transformaciones. Transformaciones lineales
Tema. 4. Medidas de posición. Medidas de posición individual, centiles
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tema 14. Estimación de parámetros: Estimación puntual y por intervalos
Tema. 6. Medidas de forma y valores atípicos. Asimetría y curtosis
Lic. Cristian R. Arroyo López
Medidas de centralización para datos no agrupados
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
ESTADÍSTICA DESCRIPTIVA
Descripción de los datos: medidas de dispersión
Unidad de competencia II Estadística descriptiva:
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Capítulo 4: Medidas de dispersión
Capítulo 3: Medidas de posición
TEMA 2.3. MEDIDAS DE TENDENCIA CENTRAL
} LISSET BÁRCENAS MONTERROZA
Coeficiente de variabilidad
DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
Medidas de tendencia central y de variabilidad
Estimación por intervalos de confianza.
Rango y Rango intercuartil
Medidas de dispersión y variabilidad
TEMA 2.4. MEDIDAS DE VARIABILIDAD
Introducción Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que junto a una medida que indique el valor alrededor del cual.
Curso de Estadística Básica
ESTADIGRAFOS DE DISPERSION
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
Facultad: Turismo Y Hotelería
Estadística Descriptiva
REPASO BLOQUE I: TEMAS 1-4
Estadística Descriptiva continuación
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Medidas de Dispersión.
Tema 2: Parámetros Estadísticos
Varianza.
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Medidas de Variabilidad
Coeficiente de Variación
Tratamiento de datos y azar
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
Medidas de dispersión.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
ANÁLISIS E INTREPRETACIÓN DE DATOS
Descripción de los datos: medidas de ubicación
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Métodos Cuantitativos
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTIMACIÓN DE PARÁMETROS
Medidas de dispersión IIIº Medio 2015.
Objetivo: Recordar elementos presentes en el estudio de la estadística
INFERENCIA ESTADÍSTICA
FORMULARIO ESTADÍSTICA DESCRIPTIVA contar, medir, pesar, evaluar, observar es el punto de partida.
Coeficiente de variación
DIPLOMADO DE POSTGRADO
Estadística descriptiva
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Estadística y probabilidad aplicada a los negocios
Estimación estadística
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
Medidas de tendencia central
Métodos Cuantitativos de Análisis de Datos I. Medidas de Variación.
Aplicaciones Aplicaciones Elaboración de un diagrama de caja y bigotes: Análisis rápido de datos Departamento de Estadística, Demografía, Humanidades.
Transcripción de la presentación:

Tema. 5. Variabilidad. Concepto Tema.5.Variabilidad. Concepto. Principales estadísticos: varianza, cuasivarianza y desviación típica y cuasidesviación. Características. Otras medidas de variabilidad. Medidas robustas de variabilidad.

Concepto de variabilidad En el tema anterior vimos las medidas de tendencia central (media, mediana, etc). Claramente, para saber cuán representativo es el valor de tal medida de tendencia central es necesario tener una medida de variabilidad. Por ejemplo, alguien puede tener una media de 5 con los siguientes datos (5, 4, 6, 5, 5) y otro tener una media de 5 con los datos (10, 0, 5, 9, 1). Evidentemente el primer sujeto es mucho más consistente, muestra menos variabilidad.

¿Cómo podemos medir la variabilidad? Una primera estrategia sería emplear la fórmula El problema es que siempre vale cero.... Una segunda estrategia es emplear valores absolutos Esta es la llamada “Desviación Media”, cuyo problema es que lo problemático del uso de valores absolutos. ¿qué nos queda, pues? Emplear la suma de diferencias al cuadrado....Es el primer paso para la varianza

Varianza Fórmula Como veremos en el segundo semestre (Estadística inferencial), la varianza es un estimador sesgado de la varianza poblacional; por ello se prefiere el uso de la “cuasivarianza” que es igual que la varianza excepto en que se divide por n-1; la cuasivarianza es un estimador insesgado de la varianza poblacional¨:

Desviación típica y cuasidesviación típica Fórmulas Una ventaja obvia de la desviación típica sobre la varianza es que la desviación típica viene dada en las mismas unidades de medida que los datos originales (en la varianza las unidades están al cuadrado). Por eso, en estadística descriptiva se suele dar la media acompañada de la (cuasi)desv.típica, más que con la (cuasi)varianza. NOTA: El SPSS cuando indica varianzas o desviaciones típicas, en realidad calcula cuasivarianzas y cuasidesviaciones típicas

Algunas propiedades de la varianza y desviación típica La varianza y la desv. Típica son valores esencialmente positivos. (Observad que las diferencias sobre la media están al cuadrado) 2. Ni la varianza ni la desv.típica se alteran cuando a los datos se les añade una constante a. Entonces, sabemos que

Entonces, sabemos que Claro está que lo mismo se aplica a la desv.típica (y a la cuasivarianza y la cuasidesv.típica

3. Si los datos se multiplican por una constante a cualquiera, la desv 3. Si los datos se multiplican por una constante a cualquiera, la desv.típica queda multiplicada por el valor absoluto de dicha constante, y la varianza por el cuadrado de dicha constante

4. Dados k grupos con n1, n2,. , nk observaciones con medias , , 4. Dados k grupos con n1, n2, ..., nk observaciones con medias , ,..., y con varianzas , ,...., Se demuestra que la varianza del total de las n1+n2+...+nk=n observaciones es igual a la media ponderada de las varianzas parciales más la varianza ponderada de las medias parciales. Esta propiedad adquiere un sentido muy importante en el segundo semestre: en la técnica llamada Análisis de Varianza (ANOVA). La idea es que la varianza total se puede descomponer en un componente intra-grupo (que es la primera parte de la expresión de arriba) y un componente entre-grupos (que es la segunda parte de la expresión de arriba).

Otras medidas de variabilidad 1. Amplitud total (AT) Es la diferencia entre los valores extremos Su ventaja es la sencillez de cálculo; el problema es que es únicamente sensible a los valores extremos (e insensible a los intermedios). 2. Desviación media (DM) El problema del empleo de la DM es la dificultad que tiene trabajar con valores absolutos. La DM es poco frecuente encontrarla en la práctica.

Otras medidas de variabilidad 3. Amplitud semi-intercuartil (Q) Está basada en el primer y tercer cuartil, lo que la hace un estadístico resistente Se emplea relativamente en alguna áreas de la psicología; se suele emplear cuando la mediana sea el índice de tendencia central.

Cómo ver la variabilidad en un gráfico Si bien es posible emplear diferentes gráficos para evaluar la variabilidad (y tendencia central, asimetría, etc), es interesante el uso de los diagramas de caja y bigotes. La caja viene definida por el primer cuartil y el tercer cuartil, con la mediana también indicada. Esto lo veremos en detalle en las prácticas. Pero mejor veamos un ejemplo (Ratcliff, Perea, Colangelo y Buchanan, en prensa, Brain & Cognition), en el que se examinan ciertas características en una tarea de decisión léxica (decidir si un estímulo era palabra o no; se mide el Tiempo de Reacción) con un grupo de controles y un grupo de personas con daño cerebral (afásicos). Lo que se medía era un índice de cuán conservador eran las personas en la tarea (“boundary separation”) un índice correspondiente a procesos “no-decisionales” (“non-decision component”). un índice correspondiente a la calidad de información (“drift rate)

Cómo ver la variabilidad en un gráfico (2) La Mediana es el trazo grueso dentro de las cajas (entre los cuartiles primero y tercero). Las puntuaciones “atípicas” están presentadas individualmente (ver que hay dos tipos de datos atípicos). Observad que los controles son claramente diferentes a los pacientes en “boundary separation” y en el “non-decision component”, mientras que hay bastante más solapamiento en la “calidad de información”.

Medidas robustas de variabilidad 1. La MEDA (Mediana de las diferencias absolutas frente a la mediana) Ejemplo de cálculo: 3,4,4,5,5,6,7,8,9,11 (Md=5.5) MEDA=1.5 Es la Mediana de 0’5, 0’5, 0’5, 1’5, 1’5, 1’5, 2’5, 2’5, 3’5, 5’5

Medidas robustas de variabilidad 2. La desviación pseudotípica Es un índice de variabilidad que permite estimar la desviación típica (que como sabemos es muy susceptible a la influencia de puntuaciones atípicas, como también ocurre con la media aritmética) que cabría esperar de la muestra si ésta perteneciera a una población en el que la distribución subyacente sea la normal.