Características de las distribuciones estadísticas

Slides:



Advertisements
Presentaciones similares
Tema. 6. Medidas de forma y valores atípicos. Asimetría y curtosis
Advertisements

Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
Epidemiología Clínica y Estadística Aplicada
ESTADIGRAFOS DE FORMA.
ESTADÍSTICA DESCRIPTIVA
MÉTODOS ESTADÍSTICOS.
FRANCISCO JAVIER RODRÍGUEZ
Medidas de tendencia central y de variabilidad
Medidas de Dispersión Estadística E.S.O.
MEDIDAS DE TENDENCIA CENTRAL
Estadística descriptiva
Introducción a la Estadística Descriptiva
Medidas de Tendencia Central Preparado por: Prof. Alice Pérez Fernández Universidad Interamericana Recinto de Fajardo.
Introducción a la estadística
REPASO BLOQUE I: TEMAS 1-4
Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva
DEPARTAMENTO DE MATEMÁTICA APLICADA
Estadística Descriptiva continuación
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Tema 2: Parámetros Estadísticos
Definición de Estadística
Medidas de resumen.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Fundamentos Matemáticos Medidas de tendencia central
Laboratorio de Estadística administrativa
Medidas de Posición y Centralización Estadística E.S.O.
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Tratamiento de datos y azar
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Estadística Descriptiva: 2. Medidas de Tendencia y Dispersión
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
ESTADÍGRAFOS DE FORMA MEDIDAS DE FORMA.
MEDIDAS DE FORMA DE LA DISTRIBUCION
Qué es una Variable Aleatoria??????????
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Descripción de los datos: medidas de dispersión
LA ESTADÍSTICA.
PARÁMETROS ESTADÍSTICOS
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Estadística Básica Conceptos & Aplicaciones
Métodos Cuantitativos
MEDIDAS DE POSICIÓN RELATIVA
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTADÍSTICA UNIDIMENSIONAL
Medidas de posición y de dispersión
MEDIDAS DE TENDENCIA CENTRAL
Elementos para el análisis estadístico
Gráficos.
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
10. Estimación puntual e intervalos de confianza Módulo II: Análisis descriptivo univariado Análisis de Datos Aplicado a la Investigación Científica
11. Los percentiles y los valores de normalidad Módulo II: Análisis descriptivo univariado Análisis de Datos Aplicado a la Investigación Científica
Coeficiente de variación
DIPLOMADO DE POSTGRADO
Describiendo los Datos, Usando Medidas Numéricas
Estadística descriptiva
Medidas de posición y dispersión IV medio
Estadística y probabilidad aplicada a los negocios
PROBABILIDAD Y ESTADISTICA.
Medidas de tendencia central
Medidas num é ricas descriptivas Estad í stica Capítulo 3.1.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, Decana de América) FACULTAD DE MEDICINA - UPG MAESTRÍA EN NEUROCIENCIAS Curso: Bioestadística.
Transcripción de la presentación:

Características de las distribuciones estadísticas Nazira Calleja

Propósito del análisis estadístico Estadística Propósito del análisis estadístico Poner orden en el caos para: Comunicar de manera clara y concisa un conjunto de datos. Obtener bases para la toma de decisiones.

Distribución de datos Resumen de la frecuencia de los valores individuales de una variable. Ejemplo: Tabla 1. Distribución de frecuencias del estado civil de los participantes Tabla 2. Distribución porcentual del estado civil de los participantes Estado civil Frecuencia Soltero 8 Casado 33 Divorciado 5 Viudo 2 Total 48 Estado civil Porcentaje Soltero 16.7 Casado 68.8 Divorciado 10.4 Viudo 4.2 Total 100.0 Enumera cada valor o grupo de valores de una variable y el número y/o porcentaje de las personas que tienen ese valor.

Gráficas Gráfica de barras Histograma Fig. 1. Distribución porcentual de la escolaridad del padre. Fig. 2. Edad en años de los participantes.

Polígono de frecuencias Gráficas Polígono de frecuencias Fig. 3. Puntajes obtenidos por los participantes en el subtest de Información general del WISC.

Diagrama de cajas y bigotes Gráficas Diagrama de cajas y bigotes

Medidas descriptivas Tendencia central Indican valores con respecto a los que los datos parecen agruparse Modo Mediana Media Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de tendencia central Rango Rango semiintercuartilar Desviación estándar Varianza Posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos Cuartiles Deciles Percentiles Forma Comparan la forma que tiene la representación gráfica con la distribución normal. Asimetría o sesgo Curtosis o apuntamiento

Un subconjunto de una población Población y muestra POBLACIÓN MUESTRA El universo de todos los casos Un subconjunto de una población Parámetros Estadísticos Letras griegas (, , ) Letras latinas ( , s, r).

Ejemplo: Estudiante Puntaje Claudia 15 Vicky 20 Carlos 23 Silvia Alejandro 34 Memo Lupita 25 Karina Andrea 16 Estudiante Puntaje 1 15 2 20 3 23 4 5 34 6 7 25 8 9 16

Distribución de frecuencias Puntaje Casos (Frecuencias) 15 1 16 20 23 25 34 Puntaje Frecuencias 15 3 16 1 20 23 2 25 34

Porcentajes y porcentajes acumulados Puntaje f % acum 15 1 11.1 22.2 33.3 16 44.4 20 55.5 23 66.6 77.7 25 88.8 34 100.0 Puntaje f % acum 15 3 33.3 16 1 11.1 44.4 20 55.5 23 2 22.2 77.7 25 88.8 34 100.0

Medidas de tendencia central Estimación del "centro" de una distribución de valores. Modo Mediana Media SPSS: Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos

Modo o moda Valor que ocurre con más frecuencia en el conjunto de puntajes. Mo Es el dato que más se repite. En algunas distribuciones hay más de un valor modal. Cuando hay dos valores con igual frecuencia, la distribución se denomina bimodal.

Modo o moda: Valor que ocurre con más frecuencia en el conjunto de puntajes. Cómputo: Enlistar todos los puntajes en orden numérico y contar el número de casos en cada puntaje. Puntaje f 15 3 16 1 20 23 2 25 34 Modo Mo = 15

Mediana Puntaje que se encuentra exactamente en el centro del conjunto de valores. 10 12 14 16 18 20 22 Mdn = 16 Md Me Mdn Es el dato que ocupa la posición central en un conjunto ordenado de datos.

Mediana Cómputo: Enlistar todos los puntajes en orden numérico (de menor a mayor) y localizar el puntaje que divide a la distribución en dos partes iguales (50% arriba y 50% abajo). Puntaje f % acum 15 1 11.1 22.2 33.3 16 44.4 20 55.5 23 66.6 77.7 25 88.8 34 100.0 4 50% Mediana 4 Mdn = 20

Posición de la Si el número de datos (n) es par, la mediana es el promedio de los dos datos centrales. Si el número de datos (n) es impar, la mediana es el dato que ocupa la posición central. Puntaje 10 11 12 14 18 23 Puntaje 10 11 12 14 18

Media o promedio Cómputo: sumar los puntajes y dividirles entre el número de casos. Estudiante Puntaje 1 15 2 20 3 23 4 5 34 6 7 25 8 9 16 Suma 186 Ejemplo: Puntajes obtenidos por 9 estudiantes en un examen: Media = 186 / 9 = 20.66

Xi (del i ésimo caso) = Xi1…..Xin Media Puntaje x f f (x) 15 3 45 16 1 20 23 2 46 25 34 Total 9 186 Xi (del i ésimo caso) = Xi1…..Xin Media = 186 / 9 = 20.66

Medidas de dispersión Dispersión Variabilidad de los valores alrededor de la tendencia central. Rango Rango intercuartilar Varianza Desviación estándar SPSS: Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos

Medidas de dispersión Rango. Distancia entre los dos puntajes extremos. Cómputo: Valor más alto menos valor más bajo + 1. Ejemplo: Puntaje 15 16 20 23 25 34 Valor más alto: 34 Valor más bajo: 15 Rango: 34 – 15 + 1= 20 Ventajas Desventajas Fácil de computar Fácil de entender Puede usarse con datos de rango y cuantitativos Es inestable (los puntajes extremos pueden exagerar el rango) Su cómputo involucra sólo dos puntajes, no la distribución completa

Desviación estándar pequeña Desviación estándar grande Medida de dispersión más exacta y detallada. Muestra la relación que un grupo de valores tiene con la media. Es la distancia promedio de los puntajes con respecto a la media. Ayuda a crear una representación más exacta de la distribución Desviación estándar pequeña Desviación estándar grande Grupo de datos donde los puntajes están muy cerca del valor de la media; existe poca variación; corresponde a un rango pequeño Grupo de datos con más variación; gran diferencia entre los puntajes; corresponde a un rango grande

Cálculo S = desviación estándar Σ = suma de X = puntaje individual M = media de todos los puntajes n = tamaño de la muestra (número de puntajes) [n-1 porque se calcula para una muestra, no para la población] Ejemplo: En una distribución con una media de 80 y una desviación estándar de 10, la dispersión será mucho mayor que si la desviación es de 2.

√ 84.1 = 9.17  Desviación estándar X M X-M (X-M)2 15 20.66 -5.66 33.04 16 -4.66 21.72 20 -0.66 0.44 23 2.34 5.48 25 4.34 18.84 34 13.34 177.95 ∑ 351.39 351.39 / 9 – 1 = 84.1  Varianza √ 84.1 = 9.17  Desviación estándar Nótese que los valores que se encuentran abajo de la media tienen discrepancias negativas y los que están arriba de la media las tienen positivas.

Medidas de posición Cuartiles Deciles Centiles SPSS: Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos

Medidas de posición Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuartiles De la misma manera en que la mediana divide a la distribución en dos partes iguales (50% debajo de ese puntaje y 50% arriba), los cuartiles la dividen en cuatro partes iguales (del 25% cada una). Son tres y se denotan: Q1, Q2 y Q3 La Mdn y el Q2 coinciden en el mismo valor.

Medidas de posición Deciles Dividen a la distribución en diez partes iguales (del 10% cada una). Son 9 y e le denotan D1, D2,..., D9. El decil 5 coincide con la Mdn en el mismo valor.

Centiles o percentiles Dividen a la distribución en cien partes iguales (del 1% cada una). Se utilizan en pruebas estandarizadas. Son 99 y se les denota P1, P2,...,P99. El percentil 50 coincide con la Mdn, con el Q2 y con el decil 5 en el mismo valor.

P = Percentiles o Centiles (99) Medidas de posición Puntaje más bajo Q1 Mdn Q2 Q3 más alto 25% 50% 75% P25 D5 P50 P75 Q = Cuartiles (3) D = Deciles (9) P = Percentiles o Centiles (99) SPSS: Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos

Rango intercuartilar: 23 – 15 = 8 Medidas de dispersión Rango intercualtilar, RIQ. Distancia entre puntajes del Q1 y Q3. Cómputo: Valor del Q3 menos valor del Q1 Ejemplo: Puntaje % acum 15 11.1 22.2 33.3 16 44.4 20 55.5 23 66.6 77.7 25 88.8 34 100.0 25% Q1 75% Q3 Q3: 23 Q1 : 15 Rango intercuartilar: 23 – 15 = 8

Diagrama de cajas y bigotes (boxplot) Gráficas Diagrama de cajas y bigotes (boxplot) Caso x 1 104 2 112 3 134 4 146 5 155 6 168 7 170 8 195 9 246 10 302 11 338 12 412 13 678 x f % % ac 104 1 7.7 112 15.4 134 23.1 146 30.8 155 38.5 168 46.2 170 53.8 195 61.5 246 69.2 302 76.9 338 84.6 412 92.3 678 100.0 Ejemplo: 25% Q1 50% Mdn 75% Q3

Diagrama de cajas y bigotes (boxplot) Gráficas Diagrama de cajas y bigotes (boxplot) Atípicos extremos: >Q3 X 3 Atípicos medios: >Q3 X 1.5 y <Q3 X 3 Límite superior: Q3 X 1.5 Rango intercuartilar (50% de la distribución) Límite inferior: Q1 X 1.5 Atípicos medios:<Q1 X 1.5 y >Q1 X 3 Atípicos extremos: < Q1 X 3

Diagrama de cajas y bigotes (boxplot) Atípico extremo (outlier) Gráficas Diagrama de cajas y bigotes (boxplot) Atípico extremo (outlier) Límite superior Q1 Rango intercuartilar Mdn Q3 Límite inferior SPSS: Gráficos - Interactivos

Diagrama de cajas y bigotes (boxplot) Gráficas Diagrama de cajas y bigotes (boxplot) SPSS: Gráficos – Generador de gráficos

Cajas y bigotes: síntesis

Medidas de forma Asimetría o sesgo Curtosis SPSS: Analizar – Estadísticos descriptivos – Frecuencias - Estadísticos

Distribución asimétrica Distribución simétrica Distribución asimétrica Asimetría o sesgo Distribución asimétrica hacia la derecha o positiva Distribución simétrica Distribución asimétrica hacia la izquierda o negativa Las frecuencias descienden más lentamente hacia la derecha que hacia la izquierda Media, mediana y modo coinciden Las frecuencias descienden más lentamente hacia la izquierda que hacia la derecha - +

Distribución asimétrica Distribución simétrica Distribución asimétrica Existen varias medidas de la asimetría de una distribución de frecuencias. Coeficiente de Asimetría de Pearson: Distribución asimétrica hacia la derecha o positiva Distribución simétrica Distribución asimétrica hacia la izquierda o negativa Valor positivo Valor = 0 Valor negativo

Moda 104a Mediana 170.00 Media 243.08 Asimetría hacia la derecha

- Curtosis + Distribución leptocúrtica mesocúrtica platicúrtica Leptós significa 'fino', 'delgado', 'agudo' Mesós equivale a 'medio', 'mediano' Platýs es 'ancho, 'plano', 'liso' Presenta un elevado grado de concentración alrededor de los valores centrales de la variable Presenta un grado de concentración medio alrededor de los valores centrales de la variable Presenta un reducido grado de concentración alrededor de los valores centrales de la variable + -

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de curtosis de Fisher. Distribución mesocúrtica Valor = 0 Distribución leptocúrtica Valor positivo: Menos aplastado que el de la distribución normal. Distribución platicúrtica Valor negativo: Más aplastado que el de la distribución normal.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de curtosis de Fisher. Distribución mesocúrtica Valor = 0 Distribución leptocúrtica Valor positivo: Menos aplastado que el de la distribución normal. Distribución platicúrtica Valor negativo: Más aplastado que el de la distribución normal.