COEFICIENTE DE CRONBACH
para cualquier par de ítems. El coeficiente de fiabilidad del test podría obtenerse aplicando la fórmula general de Spearman-Brown para datos muestrales, quedaría como: para cualquier par de ítems.
Una fórmula equivalente a la anterior; es decir, que proporciona exactamente el mismo resultado, es la denominada coeficiente α de Cronbach:
Ejemplo Items Sujetos 1 2 3 4 5 6
Ejemplo (Cont.)
INTERPRETACIÓN En este caso, el coeficiente α obtenido representa un valor medio, que nos indica que no existe un elevado grado de covariación entre los ítems. No podemos afirmar con rotundidad que este test mide un rasgo unitario.
INTERPRETACIÓN (Cont.) El coeficiente α puede obtenerse también entre diferentes grupos de ítems (subtests). En ese caso, k será el número de subtests y la suma de las varianzas de los subtests. Un coeficiente α bajo indicará que los diferentes subtests miden rasgos o constructos diferentes.
COEFICIENTE DE KUDER – RICHARDSON (KR20)
KR20 Se utiliza para pruebas dicotómicas, es similar al coeficiente de Cronbach. Por ejemplo: Si = 1 No = 0
Fórmula
KR20 Se considera que el coeficiente de confiabilidad es bueno cuando se aproxima a 1. Expresado en porcentaje: 1. mayor a 60% (confiabilidad alta) 2. mayor a 70% (es más confiable)
VALIDACIÓN
CONCEPTO DE VALIDEZ Los diferentes constructos muchas veces resultan difícilmente operativizables de manera indiscutible, y a veces se producen dudas razonables sobre qué mide un determinado test.
CONCEPTO DE VALIDEZ (Cont.) Una prueba de inteligencia general tendrá un elevado grado de validez si asigna puntuaciones altas a las personas muy inteligentes, puntuaciones medias a las personas medianamente inteligentes y puntuaciones bajas a las personas de poca inteligencia.
CONCEPTO DE VALIDEZ (Cont.) La validación es un proceso continuo, que incluye procedimientos diferentes para comprobar si el cuestionario mide realmente lo que dice medir.
TIPOS DE VALIDEZ (Clásico) Los fundamentales son denominados: Validez de contenido Validez de constructo Validez de criterio.
VALIDEZ DE CONSTRUCTO (Trochin) 1) VALIDEZ DE TRASLACIÓN Validez aparente. Validez de contenido. 2) VALIDEZ EN RELACIÓN A CRITERIOS Validez predictiva. Validez concurrente. Validez convergente. Validez discriminante.
VALIDEZ DE TRASLACIÓN Se le ha llamado así porque los dos tipos de validez que engloba lo que se quiere medir es el grado de acierto que se tiene al “trasladar” o transformar el constructo en operativización.
Validez Aparente Aquí lo que se hace es mirar la operativización y ver si “aparentemente” es una buena traslación del constructo.
Ejemplo Se puede observar las características de un programa pensado para prevenir el embarazo juvenil, y concluir que, efectivamente, parece ser un programa de prevención del embarazo juvenil.
TIP Puede mejorarse la calidad de evaluación de la validez aparente haciéndolo de un modo más sistemático. Por ejemplo, si tratamos de contrastar la validez aparente de nuestro instrumento para medir la habilidad matemática, sería más convincente que enviáramos el test a una muestra cuidadosamente seleccionada de expertos en testeo de habilidades matemáticas para que ellos nos devolvieran un juicio en el que se pronunciaran sobre la bondad de la medida que estamos utilizando.
Validez de Contenido Esta aproximación asume que se posee una detallada descripción de los contenidos o componentes relevantes al constructo, algo que no siempre sucede.
Ejemplo Se podría desplegar todos los criterios que deberían estar presentes en un programa que pretende ser “ de prevención “embarazo juvenil”. Criterios que describen los contenidos que debe tener la información básica sobre embarazo, el uso de la abstinencia, los métodos de control del embarazo, etc.
VALIDEZ EN RELACIÓN A CRITERIOS En la validez con relación a criterios, lo que se hace habitualmente es una predicción sobre cómo funcionará la operativización tomando como base la teoría sobre el constructo.
Validez Predictiva ¿Qué habilidad posee la operativización para predecir algo que teóricamente debería ser capaz de predecir?
Ejemplo Se podría teorizar sobre que una medida de habilidad matemática debería ser capaz de predecir cómo de bien se desenvolverá una persona en una profesión de las relacionadas con la ingeniería. Podríamos dar nuestra medida a ingenieros experimentados y ver si existe una alta correlación entre las puntuaciones del instrumento de medición y sus desempeños como ingenieros.
Validez Concurrente ¿Qué validez posee para establecer distinciones entre grupos entre los que teóricamente debería ser capaz de distinguir?
Ejemplo Si se estuviera trabajando en la medición de la enfermedad maníaco-depresiva, nuestra medición debería ser capaz de distinguir entre personas diagnosticadas como maníaco-depresivas y las diagnosticadas, por ejemplo, como paranoide-esquizofrénicas.
Validez Convergente ¿En qué medida la operativización es similar a (converge) otras operativizaciones a las que, teóricamente, debería parecerse?
Ejemplo Para mostrar la validez convergente de un test de habilidades aritméticas, se puede correlacionar las puntuaciones obtenidas en el test con las de otros cuya pretensión fuera medir habilidades matemáticas básicas.
Validez Discriminante ¿En qué medida la operativización no es similar (diverge) a otras operativizaciones a las que, teóricamente, no debería ser similar?
Ejemplo Para mostrar la validez discriminante de un test de habilidades aritméticas, se podría correlacionar las puntuaciones obtenidas en el test con las que se dedujeran de otro test de habilidad verbal.