ESTADISTICA APLICADA A LA INVESTIGACIÓN

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
MSP César Eduardo Luna Gurrola
ESTIMACION DE PARAMETRO
PRUEBAS DE HIPÓTESIS.
ESTADISTICA INFERENCIAL
Contraste de Hipótesis
De la muestra a la población
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estimación por intervalos de confianza.
Capítulo I. Introducción
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
Uso de pruebas estadísticas paramétricas y no paramétricas
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Estadística Computacional Prof. Miguel González Velasco
9 Regresión Lineal Simple
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clases 4 Pruebas de Hipótesis
Diseño Estadístico y Herramientas para la Calidad
ANALISIS DE DATOS CATEGORICOS
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
INTERVALO DE CONFIANZA
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Distribuciones derivadas del muestreo
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
DISTRIBUCIÓN NORMAL La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas,
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
El promedio como variable aleatoria: error estándar e intervalo de confianza para la media de la muestra Mario Briones L. MV, MSc 2005.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTIMACION POR INTERVALOS
Análisis Cuantitativo de Datos (Básico)
Inferencia Estadística
Estadística para administradores
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Estimación y contraste de hipótesis
Análisis de los Datos Cuantitativos
Aplicaciones Estadísticas a las Finanzas Clase 1
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
INTERVALO DE CONFIANZA
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Distribuciones de Probabilidad
Aspectos generales de la investigación educativa en el SNIT
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
INFERENCIA ESTADÍSTICA
Aplicaciones Estadísticas a las Finanzas Clase 1
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estadística Inferencial
Bioestadística Inferencia estadística y tamaño de muestra
Estimación estadística
DISTRIBUCIÓN T DE STUDENT
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

ESTADISTICA APLICADA A LA INVESTIGACIÓN Universidad Nacional de La Rioja Departamento de Ciencias y Tecnologías Aplicadas a la Producción, Ambiente y Urbanismo ESTADISTICA APLICADA A LA INVESTIGACIÓN Capítulo 2: Introducción a la estadística inferencial. liliana.recchioni@gmail.com

1.Probabilidad Un evento es algo que ha ocurrido, va a ocurrir o puede ser que ocurra. (que mañana llueva, que salga una cruz al tirar una moneda, que un hogar tenga más de 2 hijos, que un bebé pese menos de 1500gramos al nacer, etc.) Podemos considerar a la probabilidad como una medida de la posibilidad de ocurrencia de un evento.

Ejemplo 1: Experimento : lanzar un dado. Variable aleatoria: cara superior Evento: Cara par Probabilidad a calcular: P(cara par)

Ejemplo 2: Experimento : Medir la edad de un alumno. Variable aleatoria: edad Evento: que sea menor a 20 años. Probabilidad a calcular: P(y<20.)

Enfoques para el cálculo. Definición clásica: si un experimento puede producir n resultados diferentes, mutuamente excluyentes y equiprobables, entonces la probabilidad: Cálculo factible para el experimento del dado.

Definición frecuencial: En una tabla de frecuencia, la probabilidad se estima con la frecuencia relativa: Siempre y cuando el n sea grande. Definición subjetiva: Depende del investigador o profesional.

Distribución de Probabilidad. Indica todos los resultados probables de un experimento, así como la probabilidad de ocurrencias de estos resultados. Es similar a una distribución de frecuencia relativa, pero en vez de describir el pasado, dice qué tan probable es que ocurra un evento.

2. Función de Distribución de Probabilidad. Variable Discreta. Se abstrae en una forma funcional la metodología necesaria para calcular la probabilidad que se presenta en la tabla de distribución de frecuencia. Para variables discretas PUEDO calcular la probabilidad en un valor de la variable.

Una variable aleatoria se puede definir, como una característica no predecible con certeza, sólo en términos de probabilidad. Una variable aleatoria discreta toma valores discretos. Cantidad de asistencias en el mes, cantidad de hijos, cantidad de acciones…

Si se lanza un dado la probabilidad de que salga una determinada cara es: X P(x) 1 1/6 2 3 4 5 6 Qué tipo de definición se utiliza?

Si se mide la cantidad de hijos de mujeres que asisten al hospital: X fi P(x) 150 0,15 1 250 0,25 2 400 0,40 3 100 0,10 4 50 0,05 Más de 5 0,01 1000 Qué tipo de definición se utiliza?

3. Función de densidad para variable continua. Para una variable continua, peso, edad, habilidad, etc., sólo es posible calcular la probabilidad en un área determinada de su campo de variación. La función de densidad es la función que describe la curva. Una forma de ver cuál es la función de densidad de una variable de manera aproximada es observando el histograma. La función de densidad es el límite del histograma para n grande e intervalos infinitesimales.

Distribución Normal Gráficamente es una curva acampanada y simétrica con respecto a la media:

Parámetros de la distribución Normal Media: nos dice en dónde está centrada la distribución. Si lo modificamos, podemos "mover" la curva sobre el eje horizontal. Desviación Estándar: nos dice qué tan "ancha" o "angosta" es la distribución en su base.

Parámetros de la distribución Normal Hay infinitas normales… según la variable que se estudie…

Características: Entonces, existen muchas distribuciones Normales, una por cada combinación de valores de media y varianza. Propiedades. Es simétrica con respecto a su media El área bajo la curva vale 1.

Normal (0,1) . Normal estándard a b y

Distribución Normal Estándar Existe una distribución normal estándar que permite estandarizar todas las variables normales para llevarlas a una misma escala o unidad de medida. Es aquella distribución Normal con Media = 0 y Desv. Estándar = 1. A la variable aleatoria que sigue esta distribución se le llama Z.

Estandarización o Normalización Cualquier variable aleatoria y que se distribuye Normal(µ,σ) se puede transformar en una variable aleatoria Z que sigue la distribución Normal Estándar Normal(0,1):

Distribución Normal Estándar p P(z<-0,5) La tabla da el valor de z que acumula una probabilidad p

-1,96 1,96 Buscar en la tabla de la distribución normal la probabilidad acumulada para -1,96 y 1,96

Ejemplo: ? Si y =edad tiene una distribución normal con Entre qué valores se encuentra el 95% central de los datos? ? El 95 % central de las personas tienen entre 10 y 49 años.

No importan los cálculos, lo que importa es saber que cada característica que se mide cuantitativa continua PUEDE tener una distribución normal. Como saberlo? Cálculo empírico: Si tomo la presión arterial mínima en 1000 pacientes puedo estudiar su distribución. Realizo un histograma y veo la forma. Tomo la media aritmética como estimación de µ y el S como estimación de . Luego con media ± S tengo el 68% de los datos.

Pregunta: Qué implica que una variable se distribuya normalmente? Es posible que el peso al nacer se distribuya normalmente. Tiene el ingreso una distribución normal? Porqué?.

Distribuciones muestrales. Cuando se muestrea una población surgen estadísticos. Estos tienen un comportamiento que se estudia analizando su distribución, ya que son variables aleatorias Para estudiar o generar la distribución de cada uno, se deberían sacar muchas muestras de la población y hacer una distribución de frecuencias y realizar un histograma. Este se aproximaría a la distribución de cada uno de ellos. La distribución de la media muestral. La distribución de t de Student. (existen otras, por ejemplo: chi cuadrado y F de Snédecor)

m p s r Población Muestra de n elementos De la muestra puedo obtener estadísticos que tienen una distribución: Media muestral S t La distribución del estadístico está relacionada con la distribución de la cual proviene la muestra. Para estudiarlas podríamos sacar muchas muestras y ver su histograma…..

Ejemplo de distribución de la media aritmética. Supongamos la siguiente población: 1 2 3 4 , esta población tiene media y sigma: μ=2,50 σ2=1,25 σ= 1,118. Veamos su histograma….

Estudiemos la distribución de la media aritmética cuando el tamaño de muestra es n=2. Primero sacaremos todas las muestras posibles de tamaño 2 de la población. Luego veremos su histograma y calcularemos su media y su desviación estándar.

Estadística descriptiva Variable n μ σ2 =Var(n) media 16 2,50 0,63 Muestra   Media 1 2 1,5 3 4 2,5 5 6 7 8 9 10 11 12 3,5 13 14 15 16 Estadística descriptiva Variable n μ σ2 =Var(n) media 16 2,50 0,63

Se observa que la forma es bastante simétrica y campanular, acercándose a una normal. La media de esta nueva variable es igual a la media de la población de donde se sacó la muestra, 2,50 y la variancia es 0,63 = 1,25 / 2.

La distribución de la media. Si y tiene una distribución normal con y ~ N La media muestral tiene una distribución normal con media y desvío estándar . Donde n es el tamaño de la muestra. Si no es normal que hacer?? Sólo asegúrese de sacar una muestra mayor de 30 elementos, entonces será aproximadamente normal.

Luego, es posible estandarizar la media muestral, es tdecir Transformarla en otra escala. Entonces la media está más concentrada alrededor de m que la variable original.

La distribución t de student. Si y es normal y el desvío de la población no es conocido, luego t tiene una distribución con n-1 grados de libertad, para n menor que 30 (1) La distribución t de Student, es simétrica y está centrada en 0. Los grados de libertad están asociados al denominador del S. Los grados de libertad caracterizan a la distribución. Si n es mayor que 30, la distribución se aproxima a la NORMAL. ES DECIR SE USA UNA NORMAL.

La distribución t se encuentra tabulada para diferentes grados de libertad y para distintos niveles de probabilidad.

Debemos saber que una variable continua se puede distribuir normalmente. Que a partir de una muestra puedo calcular estadísticos, por ejemplo la media, la t, la F, el CHI. Que estos estadísticos tienen una distribución determinada: por ejemplo la media, la t, la F… etc.

Inferencia estadística. Respondemos a la pregunta ¿Cuál es el valor del parámetro poblacional desconocido? Esta estimación puede ser: Puntual: calculamos un solo valor, a partir de la muestra, y lo usamos para estimar el parámetro poblacional. de Intervalo: calculamos dos valores, a partir de la muestra, y usamos el intervalo entre ellos, como los valores estimados del parámetro.

Estimaciones. La estimación puntual de un parámetro desconocido consiste en el cálculo de un único valor numérico que sea una buena aproximación de la realidad. Un estimador puntual por sí solo es inadecuado. Se trata de buscar un rango de valores entre los que posiblemente se encuentre la cantidad que se estima: una estimación por intervalo.

Estimación Puntual. Para estimar puntualmente un parámetro uso: Son estimaciones puntuales porque se da un solo valor posible del parámetro.

Estimación por intervalos de confianza. La mayor desventaja de los estimadores puntuales es que la estimación puntual calculada de la muestra no dice nada por sí sola, del grado de incertidumbre de tal estimación, o sea, sobre qué tan probable es que la estimación esté cerca del parámetro y de qué tan cerca esté. Los estimadores puntuales brindan una información incompleta si no están acompañadas del grado de incertidumbre de la estimación puntual obtenida. La manera más frecuente de expresar tal incertidumbre, consiste en construir un intervalo dentro del cual se esperaría, con alta probabilidad , encontrar el valor del parámetro. Tal intervalo se conoce con el nombre de INTERVALO DE CONFIANZA

Intervalo de confianza (LI;LS) Nivel de confianza. El nivel de confianza (1- α) se interpreta como la probabilidad del intervalo de haber acertado en la estimación del parámetro poblacional. El complemento del nivel de confianza se llama nivel de significancia (α) y se interpreta como la probabilidad de cometer error en la estimación. Intervalo de confianza (LI;LS) Fórmula

-0,02 De 100 intervalos posibles, 5 no encerrarán al parámetro con un nivel de confianza del 95%.

Ejemplo: Analizar->Estadísticos descriptivos ->Explorar La estimación de la edad promedio es de 9,16 años IC del 95% (8.96;9.38)

Interpretación: Tengo un 95% de confianza que el intervalo encierre a De la misma manera teniendo, en cuenta la distribución del estadístico que me sirve para estimar al parámetro o la estadística asociado e él, puedo estimar intervalos para s, p entre otros.

Qué podemos hacer hasta ahora? Resumir en una tabla o gráfico información cuantitativa. Resumir en una tabla o gráfico información cualitativa y cruzar variables. Estimar puntualmente un parámetro. Estimar por intervalos de confianza un parámetro. PRECAUCIONES: Si la muestra es chica ver si la variable se distribuye aproximadamente normal. FACILIDADES: spss hace los cálculos.

Prueba de Hipótesis En una prueba de hipótesis se postula una aseveración con respecto a uno o más parámetros en la Hipótesis NULA. Se mantiene cierta esa hipótesis mientras se hace la prueba, y se la rechaza si se encuentra evidencias en la MUESTRA para ello. Si se la rechaza se acepta la hipótesis ALTERNATIVA, que mantiene lo contrario de la Nula. Se habrá probado esta última hipótesis. Lo que se quiere probar se establece en la alternativa.

Prueba de Hipótesis para la media poblacional. m. Trata de responder a la pregunta: ¿es el parámetro poblacional igual a cierto valor específico? Se compone de cinco partes: Hipótesis Nula Hipótesis Alternativa Región de Rechazo Estadística de Prueba Conclusión

Prueba de hipótesis para m 1. Hipótesis Nula (H0): Afirma el valor conocido del parámetro: μ0 es el valor supuesto del parámetro poblacional. Ejemplo: Ho) el promedio de edad es igual a 9

2. Hipótesis Alternativa (H1) Es la hipótesis que propone el investigador y la única que se puede probar. Se contradice lo que afirma la Hipótesis Nula. Sólo se prueba cuando hay suficientes evidencias en la muestra. Se prueba si se rechaza la hipótesis nula.

La hipótesis alternativa indica que el promedio poblacional es distinto al que se postuló en la hipótesis nula. Ejemplo: H1) el promedio de edad es distinto de 9

3. Región de Rechazo: La región de rechazo es aquella región que contiene a todos los valores del estadístico muestral que nos llevan a rechazar la hipótesis nula El tamaño de esa región se define en término de probabilidad que se identifica con el valor alfa α y puede valer 0,05 o 0,01. Si vale 0,01 habrá menos valores que me lleven a rechazar la hipótesis. En medicina suele usarse 0,01. Ejemplo: alfa es 5%

4. Estadística de Prueba. Se utiliza un estadístico construido a partir del estimador (se transforma el estimador) para tomar una decisión sobre la veracidad de la Hipótesis Nula. Mientras se hace la prueba se supone cierta la Ho entonces rechazo si el valor es muy extremo. Pensaré que la muestra no proviene de una población con ese parámetro establecido en la Ho. Ejemplo: t

En esta prueba para la media, se estandariza o tipifica el valor de para ubicarlo en la distribución Normal Estándar: Ejemplo:si se desea probar que la edad media de los alumnos medidos en las escuelas es de 9 años, deberé calcular con los datos muestrales un valor de t.

5. Conclusión Si el valor de t calculada CAE dentro de la región de rechazo, SE RECHAZA la hipótesis nula (H0). Esto significa que lo más probable es que la hipótesis alternativa sea cierta. Ejemplo: Nuestra t=1,601 cae dentro o fuera? Como saberlo? Para eso debemos comparar el valor p de la prueba con el alfa.

Criterio del valor p (sig.) SI esa p < alfa implica RECHAZO la hipótesis nula, es decir que pruebo la alternativa. SI es mayor NO RECHAZO, me quedo con la nula.

Entonces en las pruebas estadísticas miraré el valor de p.. Si p es menor alfa rechazo, sino no rechazo la nula. Siempre puedo cometer un error, pero puedo controlar sólo un tipo de error.

Ejemplo: En el problema de mediciones de alumnos, el investigador quiere probar si la edad promedio difiere de 9 años con una significatividad del 5%. Uso del SPSS En SPSS Analizar -> comparar medias-> Prueba T para una muestra

El valor p de la prueba aparece en Sig. (bilateral) 0. 110 El valor p de la prueba aparece en Sig.(bilateral) 0.110. Aquí se indica la significatividad de la prueba. Si “Sig.” es mayor que 0,05 NO RECHAZO. Si “Sig.” Es menor que 0,05 RECHAZO

Ejercicio: Se desea probar que la estatura media de los alumnos medidos en las escuelas es de 130cm. Usar alfa=0,05 Analizar-> comparar medias ->Prueba t para una muestra

p<0,05 luego rechazo. La media es distinta de 130cm.

Ejemplo: Probemos si el promedio del peso de los alumnos es igual a 33 kgs. Alfa 0,05 Luego como el p >0,05. No rechazo. El peso promedio es 33kilos La estimación es de 33.12 .