Tema 1: Introducción a la estadística Plantear hipótesis Obtener conclusiones Recoger datos y analizarlos Diseñar experimento Método científico y estadística.

Slides:



Advertisements
Presentaciones similares
Introducción a la estadística
Advertisements

Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Tema 2: Parámetros Estadísticos
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Estadística descriptiva
PROBABILIDAD Y ESTADISTICA.
Métodos Cuantitativos de Análisis de Datos I. Puntuaciones Típicas Escalas Derivadas.
BLOQUE: ESTADÍSTICA Y PROBABILIDAD
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
ESTADÍSTICA DESCRIPTIVA MEDIDAS DE VARIABILIDAD Psic. Gerardo A. Valderrama M.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
ESTADÍSTICA Medidas de Tendencia no Central. Medidas de Tendencia no Central. Medidas de Variabilidad Medidas de Variabilidad.
1. Parámetros estadísticos: Medidas de Centralización: Medias, moda y Mediana Medidas de Posición:Cuartiles,Deciles,Centiles Medidas de Dispersión: Rango,
ESTADISTICA I Ing. Jahaziel Acosta. CUANTILES Los cuantiles son medidas de tendencia no centrales, que permiten determinar la proporci ó n de la poblaci.
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
1  Las medidas de dispersión miden la variabilidad de los datos con relación a una medida de tendencia central.  Las medidas descriptivas más comunes.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
Estadística.
DOCTORADO EN EDUCACION
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
Medidas de Posición: Cuantiles
Introducción a las Estadísticas
MEDIDAS DE FORMA ASIMETRIA Y CURTOSIS..
Estadística Descriptiva Dr. Javier Moreno Tapia
Medidas de posición Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es.
ESTADÍSTICA UNIDIMENSIONAL
TEMA 6 Introducción a la Estadística
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
Estadística: conceptos básicos y definiciones.
ESTADÍSTICA UNIDIMENSIONAL
Apuntes de Matemáticas 3º ESO
estadistica
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
ANALISIS DE DATOS CUANTITATIVOS
Estadística.
Estadística Unidimensional Conceptos básicos.
Bioestadística. U. Málaga.Tema 2: Estadísticos 1 Bioestadística Tema 2: Estadísticos.
Medidas de Dispersión. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión.
ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS: MEDIDAS DE RESUMEN
Nivel de dificultad de una prueba Leptocúrtica (dispersión baja); Platicúrtica (dispersión alta); Mesocúrtica (dispersión media).
FACULTAD DE CIENCIAS JURÍDICAS (RELACIONES LABORALES)
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características.
Estadística para investigación 1. 2 Estadística Introducción ¿Qué es la estadística? Es una Ciencia que explica y provee de herramientas para trabajar.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
Contenidos Medidas de Tendencia Central Medidas de Variabilidad
BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO.
Tema 2: Estadísticos Bioestadística Bioestadística. U. Málaga.
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
ESTADISTICA DESCRIPTIVA
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Clases 1 Conceptos, Estadística Descriptiva, Pruebas de Hipótesis
Estadística Descriptiva
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
PROBABILIDAD Y ESTADISTICA.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población - La altura media de los individuos de un país - La idea.
Medidas de variabilidad o dispersión RANGO-DESVIACIÓN ESTÁNDAR- VARIANZA-COEFICIENTE DE VARIACIÓN- RANGO INTERCUARTÍLICO.
ESTADÍSTICA Y SU CLASIFICACIÓN 1. 2 La estadística es la ciencia encargada de recoger, clasificar, describir, analizar datos numéricos para deducir conclusiones.
Transcripción de la presentación:

Tema 1: Introducción a la estadística

Plantear hipótesis Obtener conclusiones Recoger datos y analizarlos Diseñar experimento Método científico y estadística

Definición de Estadística Es un conjunto de teorías y métodos que han sido desarrollados para tratar la recopilación, organización, presentación, análisis, interpretación y descripciones de datos muestrales con el fin de extraer conclusiones útiles de ellos.

Definición de Estadística Descriptiva Es la parte de la Estadística que se ocupa de la recopilación de datos y el tratamiento y análisis de los mismos.

Definición de Estadística Inferencial Es la parte de la Estadística que trata de inducir o inferir, a través de la muestra obtenida, que ley, distribución o modelo sigue la población de la cual se ha extraído aquella

Fases o etapas de los métodos estadísticos  Recolección  Organización  Presentación  Análisis  Interpretación

Conceptos claves Muestra: es parte de una población de objetos, personas, empresas o cosas, que es representativa del total de elementos que conforman el universo. Población: es la totalidad de las posibles observaciones o medidas que se estén considerando en alguna investigación, de cuyo conjunto se toma una muestra. Parámetro: es una medida que describe alguna característica de la población. Estadígrafo o estadístico: es una medida que describe alguna característica de la muestra.

Conceptos claves

Tema 2: Estadígrafos Básicos Adaptado de Curso de Bioestadística Universidad de Málaga

Un brevísimo resumen sobre estadísticos Centralización o Tendencia central o promedios –Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda Posición –Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Cuantiles, percentiles, cuartiles, deciles, quintiles... Forma –Asimetría –Apuntamiento o curtosis Dispersión o Variabilidad –Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Desviación típica, coeficiente de variación, rango, varianza

La media aritmética [=promedio(rango)] La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante las expresiones, según el caso: xi representa el valor de la variable; ci representa la marca de clase. Para TDNA TF TI

La media como punto de equilibrio

La mediana [=mediana(rango)] Tendremos en cuenta el tamaño de la muestra. Si N es Impar, hay un término central, el término Cálculo de la mediana en el caso de variables discretas que será el valor de la mediana. Ejemplo: El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6. La mediana de un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales.

La mediana Si N es Par, hay dos términos centrales, la mediana será la media de esos dos valores Cálculo de la mediana en el caso de variables discretas Ejemplo: El conjunto de números 5,5,7,9,11,12,15 y18 tiene mediana 10

Ejemplo con variables continuas PesoM. Clase frecFr. acum. 40 – – – – En el histograma se identifica “unidad de área” con “individuo”. Para calcular la media es necesario elegir un punto representante del intervalo: La marca de clase. La media se desplaza hacia los valores extremos. No coincide con la mediana. Es un punto donde el histograma “estaría en equilibrio” si tuviese masa.

Ejemplo (continuación) PesoM. ClaseFr.Fr. ac. 40 – – – – Moda = marca de clase de (60,70] = 65

Altura mediana

La moda [=moda(rango)] La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo. Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

La moda

Estadígrafos de Posición Se define el cuantil de orden  como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada  Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

Los cuantiles son generalizaciones de la mediana. Los cuartiles dividen a los datos en cuatro partes iguales, los deciles en diez, los quintiles en cinco, los percentiles en cien. Cuantil de orden α [=percentil(rango;k)]

Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares. –Primer cuartil = Percentil 25 = Cuantil 0,25 –Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana –Tercer cuartil= Percentil 75 = Cuantil 0,75 Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares. –Primer quintil = Percentil 20 = Cuantil 0,20 –Segundo quintil = Percentil 40 = Cuantil 0,40 –Tercer quintil= Percentil 60 = Cuantil 0,60 –Cuarto quintil= Percentil 80 = Cuantil 0,80 Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares. –Tercer decil = Percentil 30 = Cuantil 0,30 –Quinto decil = Percentil 50 = Cuantil 0,50 = mediana –Séptimo decil = Percentil 70 = Cuantil 0,70 Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias similares. –La mediana es el percentil 50 –El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%

¿Qué peso no llega a alcanzar el 25% de los individuos? –Primer cuartil = percentil 25 = 60 Kg. ¿Qué peso es superado por el 25% de los individuos? –Tercer cuartil= percentil 75= 80 kg. ¿Entre qué valores se encuentra el 50% de los individuos con un peso “más normal”? –Entre el primer y tercer cuartil = entre 60 y 80 kg. –Obsérvar que indica cómo de dispersos están los individuos que ocupan la “parte central” de la muestra. Ver más adelante rango intercuartílico. –Los diagramas de caja (‘boxplot’) sintetizan esta información (y algo más). Ejemplo 25% 2 5 % 2 5 % 2 5 % 50%

Ejemplo 25% 2 5 % 2 5 % 2 5 % 50%

Medidas de variabilidad Rango, Rango Intercuartílico, Desviación Media, Varianza, Desviación Estándar y Coeficiente de Variación Algunos datos han sido adaptados de Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras

Estadígrafos de Variabilidad o dispersión Los estudiantes de Metodología de la Investigación obtienen diferentes calificaciones en la asignatura (variabilidad). ¿A qué puede deberse? –Diferencias individuales en el conocimiento de la materia. ¿Podría haber otras razones (fuentes de variabilidad)? Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. ¿Las notas serían las mismas en todos? Seguramente No. –Dormir poco el día de la prueba, el café estaba con somnífero... Diferencias individuales en la habilidad para hacer un examen. –El examen no es una medida perfecta del conocimiento. Variabilidad por error de medida. –En alguna pregunta difícil, se duda entre varias opciones, y al azar se elige la mala Variabilidad por azar, aleatoriedad.

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa. Amplitud o Rango [=max(rango)-min(rango)] La diferencia entre las observaciones extremas. –2,1,4,3,8,4. El rango es 8-1=7 –Es muy sensible a los valores extremos. Rango intercuartílico [=CUARTIL(rango;3)-CUARTIL(rango;1)] –Es la distancia entre el primer y tercer cuartil. Rango intercuartílico = Q 3 – Q 1 = P 75 - P 25 = C 0.75 – C 0,25 –Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores. – No es tan sensible a valores extremos. Medidas de dispersión 25% 2 5 % 2 5 % 2 5 %

Muestra de edades de cinco niños En una muestra de cinco niños se observa que éstos tienen las siguientes edades: 1, 1, 4, 8 y 9. En promedio tienen 4.6 años. ¿Cuánta variabilidad hay en las edades de los niños? ¿A qué distancia quedan las edades observadas de la media muestral 4.6 años?

Diferencias de valores observados a la media muestral

Desviación Absoluta Media [=desvprom(rango)] = 0 |-3.6| + |-3.6| + |-.6| + |3.4| + |4.4| = 15.6 Distancia promedio = 15.6 / 5 = 3.12 En general:

Otra medida: Varianza 4.4x x x3.4.6x.6 Media Muestral

Varianza [=var(rango)] = 0 3.6(3.6) + 3.6(3.6) +.6(.6) + 3.4(3.4) + 4.4(4.4) = 57.2 área promedio = 57.2 / 4 = 14.3 En general:

Grados de libertad ¿Por qué calculamos la varianza dividiendo por n - 1, en lugar de dividir por n? Como la suma de las desviaciones es 0, la última desviación es una combinación lineal de las n - 1 desviaciones restantes. Por lo tanto, no estamos calculando el promedio de n números independientes (los desvíos). Solo n -1 de las desviaciones al cuadrado pueden variar libremente y por ello, promediamos la suma de los desvíos al cuadrado dividiendo por n -1. Al numero n -1 se lo denomina grados de libertad de la varianza o de la desviación típica.

Desviación estándar [=desvest(rango)] Así s = 3.78

Desviación estándar S 2= 14.3 años 2 S S=3.78 años

Asimetría y Curtosis En los temas anteriores hemos visto las medidas de tendencia central, de posición y las medidas de variabilidad. Si bien la obtención de tales medidas es clave para describir una muestra y efectuar inferencias sobre la población de origen, es también fundamental saber obtener una caracterización adecuada de los datos. Medidas de forma.

Asimetría Si bien es fácil tener una idea de si la distribución es simétrica o no tras ver la representación gráfica, es importante cuantificar la posible asimetría de una distribución. Recordemos que cuando la distribución de los datos es simétrica, la media, la mediana y la moda coinciden. (Y la distribución tiene la misma forma a la izquierda y la derecha del centro)

Índices de asimetría 1. Índice de asimetría de Pearson Muy sencillo de calcular. Está basado en la relación entre la media y la moda en distribuciones simétricas y asimétricas: Si la distribución es simétrica A s será 0 Si la distribución es asimétrica positiva, A s será mayor que 0 Si la distribución es asimétrica negativa, A s será menor que 0

Índices de asimetría 2. Índice de asimetría de Fisher Está basado en la diferencia de los datos sobre la media, como la varianza, si bien esta vez se elevan los coeficientes al cubo Si la distribución es simétrica A s será 0 Si la distribución es asimétrica positiva, A s será mayor que 0 Si la distribución es asimétrica negativa, A s será menor que 0 Desventaja: Muy influida por puntuaciones atípicas (ya lo volveremos a comentar en el último punto de este tema).

Índices de asimetría 3. Expresión en Excel En el software Excel, la función =COEFICIENTE.ASIMETRIA(A3:A14) se basa en la siguiente expresión: Si la distribución es simétrica A s será 0 Si la distribución es asimétrica positiva, A s será mayor que 0 Si la distribución es asimétrica negativa, A s será menor que 0 Desventaja: Muy influida por puntuaciones atípicas (ya lo volveremos a comentar en el último punto de este tema).

Asimetría Asimetría hacia la derecha (asimetría positiva) Asimetría hacia la izquierda (asimetría negativa) Al ser positiva significa que la gráfica es asimétrica por la derecha de la media y por tanto los valores mayores que ella están más dispersos que los menores. Al ser negativa significa que la gráfica es asimétrica por la izquierda de la media y por tanto los valores menores que ella están más dispersos que los mayores.

Curtosis o apuntamiento La curtosis representa la elevación o achatamiento de una distribución, comparada con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana. El estándar es la distribución normal: distribución mesocúrtica. Si la distribución es más apuntada que la distribución normal tenemos una distribución leptocúrtica. Si la distribución es más achatada que la distribución normal tenemos una distribución platicúrtica.

Índice de curtosis Para una distribución normal (mesocúrtica) sabemos que Y esta va a ser la referencia para el índice de curtosis que vamos a emplear Si la distribución es normal (mesocúrtica), el índice vale 0 Si la distribución es leptocúrtica, el índice es superior a 0 Si la distribución es platicúrtica, el índice es inferior a 0

Índice de curtosis Si la distribución es normal (mesocúrtica), el índice vale 0 Si la distribución es leptocúrtica, el índice es superior a 0 Si la distribución es platicúrtica, el índice es inferior a 0 En el software Excel, la función =CURTOSIS(A3:A14) se basa en la siguiente expresión:

Curtosis Leptocúrtica Platicúrtica Al ser negativa significa que la gráfica es menos apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están menos concentrados que en la Distribución Normal. Al ser positiva significa que la gráfica es más apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están mas concentrados que en la Distribución Normal.