Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca Por Juan José Igartua Perosanz1.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
ANALISIS PARAMÉTRICOS
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Tema 19: Contraste no paramétrico de hipótesis: Conceptos básicos
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
TEMA 6: CONTRASTES NO PARAMÉTRICOS
Técnicas para el análisis de datos en el enfoque cuantitativo
Técnicas para el análisis de datos en el enfoque cuantitativo
ESTADISTICA INFERENCIAL
Estadísticas Inferenciales Capítulo 10
ANÁLISIS EXPLORATORIO DE DATOS
MÉTODO CIENTÍFICO.
ANÁLISIS DE LA VARIANZA (ANOVA)
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
TALLER DE TRABAJO FINAL
TABLAS DE CONTINGENCIA
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
ALGUNOS CONCEPTOS PREVIOS
Regresión y correlación
Correlación 1.
TUTORIAL SPSS Comparación de medias con el Paquete Estadístico para las Ciencias Sociales Unidad 4.
UNIVERSIDAD DE LOS ANDES FACULTAD DE MEDICINA CENTRO DE INVESTIGACIONES PSICOLÓGICAS.
Tema 1- Regresión lineal simple.
COEFICIENTE DE CORRELACIÓN PRODUCTO-MOMENTO DE PEARSON
CURSO DE ESTADÍSTICA BÁSICA
Análisis no paramétricos
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Clases 3 Pruebas de Hipótesis
Clases 4 Pruebas de Hipótesis
ANALISIS DE DATOS CATEGORICOS
Investigación bajo el Paradigma Cuantitativo
Pronósticos, Series de Tiempo y Regresión
Mt. Martín Moreyra Navarrete.
Universidad Interamericana Recinto de Fajardo.  En la investigación se recopila una cantidad considerada de datos. Es importante, ordenarlos sistemáticamente.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Titular: Agustín Salvia
Herramientas básicas.
Regresión lineal múltiple
Diseño de EXPERIMENTOS
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
ACTIVIDAD DE PORTAFOLIOS 3
Análisis de los Datos Cuantitativos
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
Regresión Lineal Simple
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
CONTRASTES NO PARAMÉTRICOS
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Diseños clásicos de Investigación utilizados en Psicología
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL MÚLTIPLE.
InfoStat. Software estadístico
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
MÁS DE DOS MUESTRAS Procedimientos paramétricos. Pruebas de diferencias entre más de dos muestras *Con cálculos diferentes de SC y gl, según el caso.
Yuly Vanessa Agudelo Jessy Carolina Buitrago Edwin Salazar Henao.
PRUEBA DE SIGNIFICANCIA
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
PRUEBA DE SIGNIFICANCIA
7.2 P ROCEDIMIENTOS PARAMÉTRICOS PARA DATOS CUANTITATIVOS Dos muestras Intervalos de confianza.
ANALISIS DE VARIANZA.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca Por Juan José Igartua Perosanz1

Contenidos 1. Tablas de contingencia. 2. Coeficiente de correlación de Pearson. 3. Prueba t de Student, para muestras independientes. 4. El análisis de varianza de un factor (ONEWAY). Por Juan José Igartua Perosanz 2

Tablas de contingencia Mide o calcula la asociación entre (dos o más) variables medidas con una escala nominal u ordinal. Elementos a tener en cuenta para la interpretación:  Porcentajes (columna).  El estadístico Chi cuadrado (χ 2 ) y nivel de significación (p).  Análisis de residuos ajustados estandarizados.  Intensidad de la relación entre las variables. Por Juan José Igartua Perosanz 3

Ejemplo de investigación Encuesta a 40 personas (para facilitar los cálculos). Dos variables cualitativas, con una escala de medida nominal:  Ver spot IU: ¿Vio usted el spot de Izquierda Unida de la campaña electoral? 0 = No. 1 = Sí.  Votar IU: ¿Votó usted a Izquierda Unida en las elecciones? 0 = No. 1 = Sí. Problema de investigación: ¿el hecho de ver o no ver el spot de Izquierda Unida tuvo alguna influencia en el voto declarado a dicha opción política? Por Juan José Igartua Perosanz 4

Matriz de datos Metodología: Encuesta (n=40) Por Juan José Igartua Perosanz 5

Construcción de una tabla de contingencia (paso 1) Menú Analizar > Estadísticos descriptivos >Tabla de Contingencia Variable fila: VD (Votar_IU) Variable columna: VI (Ver_spot_IU) Por Juan José Igartua Perosanz 6

Construcción de una tabla de contingencia (paso 3) Porcentajes “columna” Regla de Zeisel Siempre que la variable “independiente” aparezca como variable columna. Por Juan José Igartua Perosanz 7

Construcción de una tabla de contingencia (paso 4) Botón Estadísticos Por Juan José Igartua Perosanz 8 Se solicita el estadístico Chi- cuadrado y los estadísticos para evaluar la fuerza de la asociación (nivel de medida nominal).

Resultado de la tabla de contingencia Personas que no vieron el spot de IU, que votaron IU (n=5) Personas que vieron el spot de IU, y votaron IU (n=15) Por Juan José Igartua Perosanz 9 El 75% de las personas que vieron el spot de IU, votaron por este partido. Sólo el 25% de la personas que no vieron el spot de IU, votaron IU. ¿Quién votó más a IU?

Calculo de las frecuencias esperadas y del estadístico de contraste χ 2 (paso 1) Por Juan José Igartua Perosanz 10

Calculo de las frecuencias esperadas y del estadístico de contraste χ 2 (paso 2) Por Juan José Igartua Perosanz 11

Estadístico de contraste χ 2 con SPSS La prueba  ² detecta si existe una asociación significativa entre las variables (más allá del azar). Existe una relación estadísticamente significativa entre el hecho de haber visto el spot de IU y el voto a IU [  ² (1, N=40) = 10.00, p <.002] Por Juan José Igartua Perosanz 12

Significación estadística (p) Probabilidad de equivocarse al rechazar la hipótesis nula (H 0 ), que plantea la independencia. Probabilidad de error (error tipo I) al rechazar H 0. Probabilidad de obtener un estadístico de contraste tan grande como el obtenido si H 0 (hipótesis nula) fuera cierta. La probabilidad de que las diferencias (o asociación entre las variables) pueda explicarse simplemente por el azar o la casualidad. Valores habituales en Ciencias Sociales:  p >.10 (resultado no significativo).  p <.10 (resultado tendencial).  p <.05, p <.01, p <.001 (resultado significativo). Por Juan José Igartua Perosanz 13

Obtención de los “residuos” (O-E) y “residuos (tipificados) corregidos” Los residuos tipificados corregidos que se considerarán estadísticamente significativos son aquellos cuyo valor sea mayor que 1.96 ó menor que ‑ El signo del residuo sirve para ver la dirección de la relación entre las categorías de las variables implicadas. Por Juan José Igartua Perosanz 14

Obtención de estadísticos para evaluar la fuerza de la asociación Por Juan José Igartua Perosanz 15

Coeficiente de correlación de Pearson Mide o calcula la asociación lineal entre dos variables métricas (de intervalo o razón). Elementos a tener en cuenta para la interpretación:  Diagrama de dispersión (inspección visual).  Signo del coeficiente.  Fuerza o intensidad de la asociación.  Nivel de significación (p). Por Juan José Igartua Perosanz 16

Ejemplo de investigación Encuesta a 5 personas (para facilitar los cálculos). Dos variables métricas:  X, auto-posicionamiento político (desde 0 “izquierda” hasta 10 “derecha”).  Y, práctica religiosa (desde 0 “nada” hasta 10 “mucha”). Por Juan José Igartua Perosanz 17 ¿Existe una relación estadística entre la ideología política y la práctica religiosa?

Matriz de datos Datos correlacion.sav Metodología: Encuesta (n=5) Por Juan José Igartua Perosanz 18

Cálculo MANUAL del coeficiente de correlación de Pearson Por Juan José Igartua Perosanz 19 En SPSS, la fórmula difiere ligeramente, ya que no se divide por n sino por n-1. Con muestras de gran tamaño este hecho provoca diferencias inapreciables.

Obtener un diagrama de dispersión (paso 1) Menú Gráficos > Cuadros de diálogos antiguos > Dispersión /Puntos (simple) Por Juan José Igartua Perosanz 20

Obtener un diagrama de dispersión (paso 2) Variable X: Auto- posicionamiento político Variable Y: práctica religiosa Por Juan José Igartua Perosanz 21 ACEPTAR…

Obtener un diagrama de dispersión (resultado final) Relación positiva entre X e Y ¿Pero de qué magnitud es la relación? Por Juan José Igartua Perosanz 22

Cálculo del coeficiente de correlación de Pearson (paso 1) Menú Analizar > Correlaciones > Bivariadas Por Juan José Igartua Perosanz 23

Cálculo del coeficiente de correlación de Pearson (paso 2) Por Juan José Igartua Perosanz 24

Cálculo del coeficiente de correlación de Pearson (resultado final) Ventana de resultados r(3) =.99, p <.001 Correlación entre el auto- posicionamiento religiosos y la práctica religiosa: Por Juan José Igartua Perosanz 25 gl = n – 2 = 5 – 2 = 3r 2 = Coeficiente de determinación =.99 2 =.9801

Coeficientes de correlación y tamaños de los efectos (effect size) A partir de Cohen (1988): r =.10  r 2 =.01 (x 100)  1% (varianza explicada). Efecto pequeño. r =.24  r 2 =.0576 (x 100)  5.76% (varianza explicada). Efecto moderado. r =.37  r 2 =.1369 (x 100)  13.69% (varianza explicada). Efecto grande. Por Juan José Igartua Perosanz 26

Prueba t de Student Comparación de las medias de dos grupos. Contexto de utilización: investigación experimental:  VI (variable predictora): Variable con dos valores.  VD (variable criterio): Variable con un nivel de medida métrico (intervalo o razón). Dos tipos de prueba t:  Para muestras independientes (se comparan dos grupos diferentes de casos).  Para muestras relacionadas (se comparan dos medidas distintas en una misma unidad de análisis).

Supuestos de la prueba t de Student para muestras independientes La variable criterio (dependiente) debe distribuirse normalmente.  Para comprobar este supuesto se emplea la prueba de contraste Kolmogorov-Sminornov: Analizar, Pruebas no paramétricas, K-S 1 muestra, que plantea como hipótesis nula que los datos se distribuyen de manera normal. Las varianzas en la variable criterio en los dos grupos deben ser iguales (condición de homocedasticidad).  Para comprobar el supuesto de la homogeneidad de varianzas u homocedasticidad, el SPSS calcula la prueba F de Levene, que plantea como hipótesis nula que las varianzas de los dos grupos son iguales.

Prueba t de Student con SPSS (matriz de datos) Páginas del manual Estudio sobre identificación con los personajes y persuasión Identificacion y persuasion.sav Metodología: Experimento (n=40)

Variable independiente (VI): manipulación mediante instrucciones de exposición “Dentro de breves momentos, vas a ver un cortometraje en el que una serie de personajes se encuentran en situaciones diferentes. Te pedimos que, mientras ves dicho corto, trates de imaginar cómo se sienten los personajes en las situaciones a las que se enfrentan. Piensa que tú eres uno de los personajes, que eres tú quien se enfrenta ante esas situaciones y siente las mismas emociones que ellos. Intenta concentrarte en la propia experiencia o vivencia de los personajes, trata de visualizar cómo se sienten éstos por enfrentarse a las situaciones. En definitiva, trata de identificarte con sus sentimientos y reacciones. Después de la visión del corto te preguntaremos una serie de cuestiones sobre las mismas”. “Dentro de breves momentos, vas a ver un cortometraje en el que una serie de personajes se encuentran en situaciones diferentes. Te pedimos que, mientras ves dicho corto, observes con mucha atención todo lo que hacen dichos personajes. Observa cuidadosamente todos los matices o aspectos de sus comportamientos. Intenta observar tanto la frecuencia de determinadas conductas como las reacciones no verbales de los personajes. Por ejemplo, observa sus gestos, sus cambios de postura corporal, sus miradas, etc. En definitiva, observa la conducta de estos personajes tan cuidadosamente como puedas pero no trates de identificarte o empatizar con ellos. Después de la visión del corto te preguntaremos una serie de cuestiones sobre las mismas”. IDENTIFICACIÓNDISTANCIAMIENTO

Contrastar el supuesto sobre la “normalidad” de la variables criterio o dependientes (paso 1) Menú Analizar > Pruebas no paramétricas > K-S de 1 muestra

Contrastar el supuesto sobre la “normalidad” de la variables criterio o dependientes (paso 2)

Contrastar el supuesto sobre la “normalidad” de la variables criterio o dependientes (resultado final) El test aplicado sobre la variable VD, arrojó un valor de y el nivel de significación es mayor que 0.05 (Z=0.91, p=0.366), por lo que se acepta la hipótesis nula y se concluye que la distribución de los datos de la variable VD se ajustan a la curva normal.

Obtención del estadístico de contraste t de Student para muestras independientes (paso 1) Menú Analizar > Compara medias > Prueba T para muestras independientes

Obtención del estadístico de contraste t de Student para muestras independientes (paso 2)

Obtención del estadístico de contraste t de Student para muestras independientes: información descriptiva

Obtención del estadístico de contraste t de Student para muestras independientes: estadísticos de contraste Comprobación del supuesto de “homocedasticidad” (F de Levene) Comprobación de la “manipulación experimental” (IDENT) y del efecto de VI sobre VD (t de Student) IDENT: t(38)=13.42, p<0.001 VD: t(38)=8.35, p<0.001

El análisis de varianza Comparación de las medias de 3 o más grupos. Contexto de utilización: investigación experimental con diseños multigrupo:  VI (variable predictora): Variable con 3 o más valores.  VD (variable criterio): Variable con un nivel de medida métrico (intervalo o razón). Tipos de pruebas de análisis de varianza:  Procedimiento ONEWAY (1 sola VI).  Procedimiento UNIANOVA (2 ó más VI’s).  Procedimiento GLM (General Linear Model) para diseños más complejos (multivariados, medidas repetidas).

Rasgos generales del ANOVA Grupo 1: alto miedoGrupo 2: bajo miedoGrupo 3: control Σ= 31Σ= 17Σ= 16 Media G1 = 31/5 = 6.2Media G2 = 17/5 = 3.4Media G3 = 16/5 = 3.2 Media total (Gran media) = ( ) / 15 = 4.27 Si se comparan los distintos tratamientos experimentales entre sí, se observa cierta varianza (inter-grupos). Un segundo tipo de varianza, no atribuible a la manipulación de la variable independiente, se debe a que las puntuaciones dentro de cada tratamiento o grupo experimental presentan cierta varianza (intra-grupos). ¿Por qué los valores de la variable dependiente varían entre los diferentes sujetos? ¿Por qué las puntuaciones de cada sujeto que forma parte de los distintos tratamientos experimentales son diferentes, generando cierta varianza? Páginas del manual Varianza Inter / Intra

Supuestos del ANOVA Cada muestra (o grupo) presenta una distribución normal en la(s) variable(s) dependiente(s). Las varianzas de cada grupo son iguales (es decir, debe existir homocedasticidad). Para comprobar este supuesto, el SPSS dispone de pruebas de contraste como el test de Levene de homogeneidad de varianzas (en el procedimiento ONEWAY. Las puntuaciones observadas en la variable dependiente son estadísticamente independientes; es decir, que no existe una relación concomitante con ninguna otra variable.

El análisis de varianza de un factor (ONEWAY) con SPSS (matriz de datos) Páginas del manual Angulo tomas y percepcion.sav Estudio sobre el efecto del ángulo de las tomas con la cámara en el percepción del personaje Metodología: Experimento (n=60)

Variable independiente (VI): porcentaje de planos con diferente angulación de la cámara Se crearon 3 versiones de entrevista, de modo que cada grupo fue expuesto a una de las versiones del programa. En la edición final de la entrevista se manipuló el porcentaje de planos con diferente angulación de la cámara, realizados sobre el personaje entrevistado:  En la condición “tomas en picado”, el 80% de los planos que enfocaban al personaje utilizaban una toma en picado, el 15% en contrapicado y el 5% eran tomas a la altura de los ojos.  En la condición “tomas en contrapicado”, el 80% de los planos que enfocaban al personaje utilizaban una toma en contrapicado, el 15% en picado y el 5% eran tomas a la altura de los ojos.  Finalmente, en la condición “tomas a la altura de los ojos”, el 80% de los planos que enfocaban al personaje utilizaban una toma a la altura de los ojos, el 10% en picado y el 10% eran tomas a en contrapicado.

Realización de la prueba del análisis de varianza de un factor (paso 1) Menú Analizar > Compara medias > ANOVA de un factor

Realización de la prueba del análisis de varianza de un factor (paso 2): VI y VD

Realización de la prueba del análisis de varianza de un factor (paso 3): Estadísticos

Realización de la prueba del análisis de varianza de un factor (paso 4) : contrastes planeados Angulación de la cámara (VI) Coeficientes de los contrastes - Tomas en picado - Tomas en contrapicado - Tomas a la altura de los ojos 2 Suma de los coeficientes0

Realización de la prueba del análisis de varianza de un factor (paso 5): pruebas post hoc

Resultados de la prueba del análisis de varianza de un factor: descriptivos

Resultados de la prueba del análisis de varianza de un factor: gráfico de medias

Resultados de la prueba del análisis de varianza de un factor: prueba F de Levene El estadístico F de Levene resulta estadísticamente significativo [F(2, 57)=4.68, p<0.013], lo que significar que se debe rechazar la hipótesis nula que asumía varianzas iguales entre los grupos. Dado que no se cumple el supuesto de la homocedasticidad habrá que tomar como estadístico de referencia para contrastar el efecto de la variable independiente sobre la dependiente el valor de la F de Welch.

Resultados de la prueba del análisis de varianza de un factor: ANOVA y F de Welch F de Welch [F(2, 39,99)=174.49, p<0.001]. La angulación de las tomas influye en la percepción del personaje. ¿Se puede concluir a partir de estos datos que la mejor evaluación del personaje se produce cuando la entrevista se ha editado con un predominio de tomas a la altura de los ojos? NO. El estadístico F es una prueba ómnibus, sólo permite afirmar que los grupos son diferentes pero no apunta en ninguna dirección.

Resultados de la prueba del análisis de varianza de un factor: contrastes planeados t(27.44)=16.30, p<.001

Resultados de la prueba del análisis de varianza de un factor: pruebas post hoc La mejor evaluación se obtiene cuando la entrevista ha sido editada con un predominio de tomas a la altura de los ojos (M=7.23), seguida de la versión editada con tomas en contrapicado (M=3.36), recibiendo la valoración más negativa la edición con tomas en picado (M=2.02). Estas diferencias de medias son estadísticamente significativas (p<0.001), a partir de los datos obtenidos con la prueba post hoc T3 de Dunnett.