Tema 7 Baremación, estandarización y equiparación de puntuaciones

Tema 7 Baremación, estandarización y equiparación de puntuaciones
PSICOMETRÍA Tema 7 Baremación, estandarización y equiparación de puntuaciones Salvador Chacón Moscoso Susana Sanduvete Chaves Agradecemos a Francisco Pablo Holgado Tello su inestimable colaboración en la elaboración de este material

Tema 7 Baremación, estandarización y equiparación de puntuaciones
1. Asignación de puntuaciones. 2. Establecimiento de puntos de corte en los tests referidos al criterio. 21. Procedimientos centrados en el test. 2.2. Procedimientos centrados en las personas. 2.3. Procedimientos de compromiso. 3. Transformación de puntuaciones en tests normativos. 3.1. Transformaciones lineales de las puntuaciones. 3.2. Transformaciones no-lineales de las puntuaciones. 3.3. Normas cronológicas 3.4. Establecimiento y tipos de normas. 4. Equiparación de puntuaciones. 4.1. Definición de equiparación y términos relacionados. 4.2. Diseños de equiparación. 4.3. Métodos de equiparación. 5. Elaboración de la documentación que acompaña al test. 5.1. El manual del test. 6. Valoración de la TCT. 7. Bibliografía básica. El tema 10, es el último del tema del bloque dedicado a la TCT, aborda la aplicación del test y evaluación de los sujetos. En primer lugar aparecen las orientaciones didácticas donde se marcarán los objetivos, y se resalta la importancia del tema en el conjunto de la asignatura. A continuación aparece, un bloque central con los contenidos específicos del tema, y para finalizar veremos algunos ejercicios de autocomprobación y se mostrará bibliografía relevante comentada.

Asignación de puntuaciones

ASIGNACIÓN DE PUNTUACIONES
Una vez administrado el conjunto de ítems, las puntuaciones obtenidas deben combinarse para obtener una que refleje la posición del sujeto en el test. Puntuaciones en test formados por ítems dicotómicos, encontramos varias situaciones a tener en cuenta para asignar la puntuación total: El sujeto conoce la respuesta correcta. El sujeto no conoce la respuesta correcta: b.1- omite el ítem b.2- responde incorrectamente b.3- elija la respuesta correcta por azar. Una vez administrado el conjunto de elementos, las puntuaciones obtenidas deben combinarse para obtener una puntuación global que refleje la posición del sujeto en el test. En los tests formados por ítems dicotómicos pueden darse varias situaciones que es conveniente tener en cuenta para asignar la puntuación total: a) que el sujeto conoce la respuesta correcta. b) que el sujeto no conoce la respuesta correcta: y entonces, omite el ítem; responde incorrectamente; o elige la respuesta correcta por mero azar. Todas estas situaciones es necesario tenerlas en cuenta a la hora de asignar la puntuación total del sujeto en el test.

1. Puntuaciones de tests formados por ítems sin opciones (completar, respuesta corta,...): Sumar las puntuaciones de los ítems (1 acierta; 0 falla). Donde; Xa es la puntuación total del sujeto a y xai es la respuesta del examinado a al ítem i. Un posible procedimiento para asignar puntuaciones en test formados por ítems sin opciones (como los de completar, o respuesta corta, por ejemplo) es sumar las puntuaciones de los ítems (en donde 1 indica que lo ha acertado y 0 que lo ha fallado). Para ello se aplica la siguiente expresión donde: X es la puntuación total del sujeto a y x es la respuesta del examinado a en el ítem i. Bajo este procedimiento, todos los ítems reciben el mismo peso y no se puntúan los ítems en blanco u omitidos. Todos los ítems reciben el mismo peso y no se puntúan los ítems en blanco u omitidos

2. Puntuaciones de tests con ítems de opción múltiple o V-F: existencia de diferencias individuales en relación a la tendencia a omitir o responder a ítems de los que no se conoce la respuesta  variación adicional a las puntuaciones observadas, ajena al rasgo que mide el test. Ejemplo. Dos sujetos responden a 100 ítems de 4 opciones. Ambos conocen sólo 72 ítems, pero mientras que el sujeto A responde a los 28 restantes por adivinación, el sujeto B los deja sin responder. Otra tipo de puntuaciones son las de test con ítems de opción múltiple o V-F. En estos casos hemos de contar con las diferencias individuales en relación a la tendencia a responder ítems de los que se desconoce la respuesta. Así por ejemplo, habrá sujetos que a pesar de desconocer la respuesta del ítem tiendan a responder, mientras que habrá otros que lo omitirán. Ello, implica la existencia de variación adicional en las puntuaciones observadas, ajenas al rasgo que mide el test. Así por ejemplo, supongamos que dos sujetos responden a 100 ítems de 4 opciones de respuesta. Ambos conocen sólo 72 ítems, pero mientras que el sujeto A responde a los 28 restantes por adivinación; el sujeto B los deja sin responder. Si calculamos la puntuaciones de ambos sujetos en el test, el sujeto A habrá acertado los 72 que conocía más 7 de los que no conocía por mero azar, es decir, su puntuación en el test es de 79; mientras que el sujeto B, habrá acertado sólo los 72 ítems que conocía. Esta diferencia de 7 puntos, no tiene nada que ver con sus conocimientos, sino con la diferencia en la respuesta a los ítems que no conoce. 1. Responde correctamente a los 72 más a 7 por mero azar su puntuación es de 79. 2. Sólo responde correctamente a los 72 ítems que conoce  su puntuación es de 72. Esta diferencia de 7 puntos, no tiene nada que ver con sus conocimientos, sino con la diferencia en la respuesta a los ítems que no conoce

2.1. Corrección penalizando los errores: Donde: A es el número de aciertos; E, es el número de errores; y k el número de alternativas del ítem. Para corregir dicho sesgo, se puede utilizar la fórmula de corrección de errores, tal y como se expresa a continuación. Donde A es el número de aciertos, E, es el número de errores y k el número de alternativas del ítems. Volviendo a los datos del ejemplo anterior, si calculamos las puntuaciones de ambos sujetos corrigiendo el efecto del azar, en este caso ahora ambos obtienen 72 puntos. 1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar y comete 21 errores que penalizan restando 7 puntos  su puntuación es de 72 2. El sujeto B, sólo responde correctamente a los 72 ítems que conoce, luego no comete ningún error  su puntuación sigue siendo de 72

2.2. Corrección bonificando las omisiones: atribuye a los sujetos una serie de aciertos adicionales que hubiese tenido si contestase al azar los ítems que no respondió. Donde: B es el número de ítems dejados en blanco; y k el número de alternativas del ítem. Otro procedimiento de corrección consiste en bonificar las omisiones, que atribuye a los sujetos una serie de aciertos adicionales que hubiese tenido si contestase al azar los ítems que no respondió. Para ello, se aplica la siguiente expresión donde: B; es el número de ítems dejados en blanco; y k es el número de alternativas del ítem. Si volvemos al ejemplo anterior y aplicamos la fórmula que bonifica las omisiones encontramos que ambos sujetos vuelven a obtener la misma puntuación, en este caso 79 puntos. 2. El sujeto B, sólo responde correctamente los 72 ítems que conoce; y se le suma 7 que hubiera respondido correctamente por azar  su puntuación es de 79 1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar, y no deja ninguno sin responder su puntuación sea de 79.

Estudios empíricos muestran que los sujetos no se comportan según los supuestos de las fórmulas de corrección, es decir, los sujetos que no conocen el ítem, normalmente no responden totalmente al azar: No tienen en cuenta el conocimiento parcial de los sujetos sobre algunos ítems. Diferencias individuales en la conducta de asumir riesgos a la hora de responder a los ítems. Estudios empíricos muestran que los sujetos no se comportan según los supuestos de las fórmulas de corrección, es decir, los sujetos que no conocen el ítem, no responden totalmente al azar. Estas fórmulas, por lo general, no tienen en cuenta: El conocimiento parcial de los sujetos sobre algunos ítems. Y tampoco consideran las diferencias individuales en la conducta de asumir riesgos a la hora de responder a los ítems.

Crocker y Algina (1986) proponen distintos métodos para controlarlo:
ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial Por tanto, es necesario destacar que entre los sujetos que tienen la misma puntuación en un test de elección múltiple, puede haber diferentes grados de conocimiento. A ello se le denomina: Créditos de conocimiento parcial. Crocker y Algina (1986) proponen distintos métodos para controlarlo: Ponderación de confianza. Elegir hasta la respuesta correcta. Ponderación de las opciones. Un problema que ha recibido mucha atención, es cómo tener en cuenta el conocimiento parcial. Es decir, entre sujetos que tienen la misma puntuación en un test de elección múltiple, puede haber diferentes grados de conocimiento. Para cuantificarlo, Crocker y Algina (1986) proponen distintos métodos para controlarlo: A) Ponderación de confianza. B) elegir hasta la respuesta correcta. C) ponderación de las opciones

ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial
1. Ponderación de confianza: 2. Hasta la respuesta correcta: 3. Ponderación de las opciones: Elegir la opción que se cree más correcta y asignar un valor en función del grado de corrección que atribuye a su respuesta sujetos que eligen la misma respuesta pueden obtener distinta puntuación en función del grado de confianza que han atribuido. Se selecciona una opción, y se recibe feedback. Si la respuesta es correcta pasa al siguiente ítem; si es incorrecta debe hacer una nueva elección. para puntuar el test, se resta el número total de respuestas de las que ha realizado el sujeto. La ponderación de confianza; consiste en que los examinados eligen la opción que creen correcta y asignan un valor en función del grado de corrección que atribuye a su respuesta. ..> ello, implica que sujetos que eligen la misma respuesta pueden obtener distinta puntuación en función del grado de confianza que han atribuido. Hasta la respuesta correcta: en este caso, el examinado lee el ítem, selecciona una opción e inmediatamente recibe feedback sobre su elección. Si la respuesta es correcta pasa al siguiente ítem; si es incorrecta debe hacer una nueva elección; y así sucesivamente hasta que acierte. Para puntuar el test, se resta del número total de posibles respuestas, las que ha realizado el sujeto. Y por último, en el método de la ponderación de las opciones, se parte del supuesto de que las opciones pueden variar en cuanto al grado de corrección; y que los sujetos que eligen la correcta tienen más nivel de los examinados que eligen la menos correcta. Para determinar los pesos de las opciones, suele utilizarse juicio de expertos. En general, estos procedimientos no han mostrado aumentos y mejoras con respecto a la validez de las pruebas Las opciones pueden variar en cuanto al grado de corrección; los sujetos que eligen la correcta tienen más nivel de los examinados que eligen la menos correcta.  para determinar los pesos suele utilizarse juicio de expertos. En general, estos procedimientos no han mostrado mejoras respecto a la validez de las pruebas

Puntos de corte en TRC

INTERPRETACIÓN DE PUNTUACIONES. TRN Y TRC
Una empresa desea promocionar un puesto de trabajo. Aplica un test de 70 ítems de elección múltiple. Un empleado obtiene 40 puntos. Con estos datos podríamos preguntarnos: 1. ¿podríamos decir que el rendimiento del sujeto sería adecuado para dicho puesto, o hay sujetos más competentes? 2. ¿debería realizar un cursillo intensivo de adecuación al nuevo puesto? Si sólo nos centramos en que ha obtenido 40 puntos de 70, no podríamos responder a ninguna cuestión. Para ello: Seleccionar una muestra representativa, y a continuación realizar una distribución de frecuencias, y comprobar el lugar que ocupa nuestro sujeto dentro de su grupo y así determinar si hay sujetos más competentes. Establecer un criterio para discernir si el sujeto está por encima y por tanto ocupa el puesto, o si está por debajo y por tanto ha de acudir al curso de formación. Imaginemos que una empresa desea promocionar un puesto de trabajo. Para ello, aplica un test de 70 ítems de elección múltiple. Y un empleado obtiene 40 puntos en dicha prueba. Ante ello, podemos preguntarnos si: Podríamos decir que el rendimiento del sujeto sería el adecuado para dicho puesto: Si debería realizar un cursillo intensivo de adecuación al nuevo puesto. Ya que si sólo nos centramos en que ha obtenido 40 puntos de 70, no podríamos responder a ninguna de las cuestiones. Para ello, Para responder a la primera de las cuestiones tendríamos que seleccionar una muestra representativa, y a continuación realizar una distribución de frecuencias y comprobar el lugar que ocupa nuestro sujeto para poder determinar si hay otros sujetos más capacitados. Para responder a la segunda cuestión, tendríamos que establecer un criterio para discernir si el sujeto está por encima y por tanto ocupa el puesto, o por el contrario está por debajo y debería acudir al curso de formación para capacitarlo. La puntuación del sujeto es la misma en ambos casos, es decir, 40 puntos. Sin embargo, la interpretación que debemos hacer para responder ambas cuestiones es bien distinta: en un caso es referida a la NORMA; y en el otro referida al CRITERIO. La puntuación del sujeto es la misma en ambos casos (40). Sin embargo, la interpretación que hacemos para responder ambas cuestiones es muy distinta; en un caso es referida a la NORMA; y en el otro referida al CRITERIO

Test referidos a NORMAS Test referidos al CRITERIO
ESTABLECIMIENTO DEL PUNTO DE CORTE EN LOS TRC Test referidos a NORMAS Test referidos al CRITERIO 1. Finalidad de la evaluación poner de relieve las diferencias individuales en el rasgo que mide el test - estimar el rendimiento de los sujetos en los objetivos que mide el test 2. Construcción del test y especificación de los contenidos. - los ítems suelen derivarse de alguna teoría. - se comienza con una clara especificación del dominio y del uso pretendido del test. 3. Selección de ítems. - se ha de maximizar la varianza del test, seleccionando ítems de dificultad media y alto poder discriminativo. - los ítems se seleccionan en función de los objetivos y uso pretendido del test. 4. Significado de puntuaciones. - Suponen un indicador de la puntuación verdadera del sujeto. - Supone un estimador muestral del rendimiento del sujeto en el dominio. 5. Interpretación de puntuaciones - la puntuación tiene significado únicamente en relación al grupo - la puntuación tiene significado en términos absolutos. Mediante la siguiente tabla, se resumen las principales diferencias entre los TRN y los TRC, en cuanto a las características del test. Así por ejemplo La finalidad de la evaluación en los TRN es poner de relieve las diferencias individuales en el rasgo que mide el test.. Por el contrario, en los TRC el objetivo es estimar el rendimiento de los sujetos en los objetivos que mide el test. En cuanto a la construcción del test y especificación de los contenidos, mientras que en los TRC los ítems suelen derivarse de alguna teoría; en los TRC se comienza con una clara especificación del dominio y del uso pretendido del test. En cuanto a la selección de ítems. En los TRC, se pretende maximizar la varianza del test, para poner de relieve las diferencias individuales, seleccionando ítems de dificultad media y alto poder discriminativo. Sin embargo, en los TRC los ítems se seleccionan en función del los objetivos y uso pretendido del test. En relación con el significado de las puntuaciones. En los TRN, suponen un indicador de la puntuación verdadera del sujeto en el rasgo que está midiendo el test. Sin embargo, en los TRC suponen un estimador muestral del rendimiento del sujeto en el dominio. Por último, en cuanto a la interpretación de las puntuaciones. En los TRN, la puntuación de un sujeto, tiene significado únicamente en relación al grupo. Mientras que en los TRC la puntuación tiene significado en términos absolutos.

TESTS REFERIDOS AL CRITERIO:
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE TESTS REFERIDOS AL CRITERIO: Una de las principales funciones de los test es proporcionar datos para la toma de decisiones establecimiento de PUNTOS DE CORTE para decidir sobre el rendimiento de los sujetos. Punto de corte o estándar: es un punto de la escala que sirve para clasificar a los sujetos en dos categorías que suponen diferentes niveles de competencia en relación a un dominio. 1. Métodos centrados en el test: juicios de los expertos acerca de los ítems del test. 2. Métodos centrados en las personas: opiniones de los jueces sobre la competencia de las personas. 3. Procedimientos de compromiso: combina criterios absolutos (como los anteriores), con criterios relativos. Precisamente, una de las principales funciones de los test es proporcionar datos para la toma de decisiones, donde es necesario establecer puntos de corte para decidir sobre el rendimiento de los sujetos en relación con el dominio que se está midiendo. Precisamente, el punto de corte es un punto de la escala que sirve para clasificar a los sujetos en dos categorías que suponen diferentes niveles de competencia en relación con el dominio. Normalmente se clasifica en apto-no apto, sujeto clínico-no clínico, accede al puesto de trabajo – no accede, etc. Para ello, podemos encontrar: 1. Métodos centrados en el test: que se basan en opiniones de los jueces sobre los ítems del test. Es decir, una persona que sea mínimamente competente en Psicometría qué conocimientos demostrar. 2. Métodos centrados en las personas: que en este caso se basa en opiniones de los jueces sobre la competencia de las personas. 3. Métodos de compromiso; que combina criterios absolutos como los anteriores con criterios relativos basados en la ejecución de la muestra.

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Nedelsky Métodos centrados en el test: 1.1. Método de Nedelsky (1954): es un método muy utilizado en los test de competencia mínima. Identificar una población de jueces y seleccionar una muestra. Cada juez debe definir un sujeto mínimamente competente y predecir la conducta de ese examinado en cada una de las opciones de los distintos ítems indicando cuáles eliminaría. Para cada ítem, el juez registra el recíproco del número de alternativas que quedan. Por ejemplo, en un ítem de 3 alternativas, si se ha eliminado 1, el recíproco sería 1/2 . Para cada juez, se suman los recíprocos de todos los elementos del test, obteniéndose el valor esperado del test en cada juez. Se promedian los valores obtenidos de todos los jueces, y ese valor se toma como valor inicial del estándar. Asume que los examinados mínimamente competentes eligen al azar de entre las alternativas que no pueden identificar inmediatamente como incorrectas. Lo que es cuestionable

Es el método más utilizado, investigado y recomendado
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Angoff Métodos centrados en el test: 1.2. Método de Angoff (1971): introduce una variación al método de Nedelsky. Identificar una población de jueces y seleccionar una muestra. Cada juez debe definir qué significa para él la competencia mínima; y consensuarla con el resto de jueces. Considerar cada ítem del test y decidir para cada uno de ellos la probabilidad de que un examinado mínimamente competente responda al ítem correctamente (estimación a-priori de la dificultad) Para obtener el punto de corte se suman todas las probabilidades y se promedian para todos los jueces. Es el método más utilizado, investigado y recomendado

Métodos centrados en el test:
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Ebel Métodos centrados en el test: 1.3. Métodos de Ebel (1972): Propuso un procedimiento parecido al de Angoff, pero considerando la relevancia (esencial; importante; aceptable; y cuestionable); y el nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem. Identificar una población de jueces y seleccionar una muestra. Clasificar cada uno de los elementos del test, en la correspondiente casilla; y contar el número de ítem de cada casilla. Cada juez asigna un porcentaje que representa el de ítems de cada casilla que podrían ser respondidos correctamente por un sujeto mínimamente competente.

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Ebel Métodos centrados en el test: 1.3. Métodos de Ebel (1972): relevancia (esencial; importante; aceptable; y cuestionable); nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem. Se determina el punto de corte, de acuerdo con la siguiente fórmula:

Métodos centrados en las personas
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método del grupo límite. Métodos centrados en las personas 2.1.Método del grupo límite: cuando hay evidencias claras de qué examinados son aptos y no-aptos, puede evaluarse el test y su punto de corte. Zieky y Livingston (1977): Identificar una población de jueces y seleccionar una muestra. Es imprescindible que sean capaces de juzgar el nivel de rendimiento de los sujetos por las puntuaciones del test. Se pide a los jueces que definan tres categorías: competente; límite; e inadecuado o incompetente. Los jueces evalúan a los examinados, y basándose en otras informaciones calificarían al grupo de los “límites”. Tras asignar los sujetos a los grupos, se aplica el test. Y se calcula la mediana de las puntuaciones obtenidas por los sujetos de la categoría “límite”; y ese valor se toma como estándar o punto de corte. Destaca su simplicidad. La principal crítica es la capacidad que se atribuye a los jueces para evaluar a los sujetos.

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste. Métodos centrados en las personas 2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados. ; b); y c) Las tres primeras fases son iguales que en el método del grupo límite: (Selección de jueces; que definan las categorías; y que clasifiquen a los sujetos). Los sujetos realizan el test; y los estándares se establecen en función del rendimiento de “competentes” e “incompetentes”. Se estable como punto de corte, la puntuación que mejor discrimina entre los dos grupos. En el método de los grupos de contraste los juicios se basan en el rendimiento de los sujetos examinados. Las tres primeras fases son iguales a las del método anterior; es decir, se seleccionan los jueces; se definen las categorías de competentes e incompetentes; y finalmente se aplica el test. A partir de ahí, los estándares se establecen en función del rendimiento del grupo de competentes e incompetentes. Y precisamente como punto de corte utilizaremos la puntuación que mejor discrimina entre los dos grupos.

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste Métodos centrados en las personas 2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados. Estándar Puntuaciones en el test Sujetos Así por ejemplo, un hipotético punto de corte, puede venir dado por la intersección entre ambas distribuciones, es decir, la de los sujetos competentes e incompetentes. Ya que iguala los dos tipos de errores, es decir aptos verdaderos que no pasan el test, y no aptos que sí pasan el test. Desplazar el punto de corte a la derecha implica primar la presencia de falsos negativos y desplazarlo a la izquierda la de falsos positivos. Si por ejemplo, el test pretende seleccionar a los sujetos encargados de apretar el botón nuclear que duda cabe que habrá que ser lo más conservador posible y desplazar el punto de corte lo más a la derecha posible para asegurarnos de que no haya ningún falso positivo, es decir, un sujeto que habiendo pasado el punto de corte no sea competente. F.Neg. F.Post. El punto de corte viene dado por la intersección entre ambas distribuciones: incompetentes y competentes  igualar ambos tipos de errores, es decir aptos verdaderos que no pasan el test; y no aptos que sí pasan el test.

3.1. Método de Beuk (1984): Los jueces responden a dos preguntas:
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso 3. Procedimientos de compromiso: Los métodos anteriores se basaban en criterios absolutos, ya que son los jueces los que establecen un mínimo para poder pasar, independientemente de lo que haga el grupo. Estos métodos combinan información tanto de carácter absoluto como relativo y tratan de llegar a un compromiso combinando ambos tipos de datos. 3.1. Método de Beuk (1984): Los jueces responden a dos preguntas: a) porcentaje mínimo de ítems de la prueba que deben responder correctamente las personas para superarla  datos absolutos. b) porcentaje de personas que superarán la prueba datos relativos. - Finalmente con los datos empíricos del test se establece un punto de corte de compromiso. Los métodos anteriores se basaban únicamente en criterios absolutos, ya que son los jueces los que establecen un mínimo para que los examinados puedan pasar, independientemente de los que haga el resto del grupo. Sin embargo, los métodos de compromiso, combinan información tanto de carácter absoluto como relativo y tratan de llegar a un compromiso combinando ambos tipos de datos. Entre ellos, destaca el método de Beuk (1984), que se basa en dos preguntas que han de responder los jueces: La primera hace referencia al porcentaje mínimo de ítems de la prueba que deben responder correctamente los personas para superarla. Y la segunda hace referencia al porcentaje de personas que superarán la prueba  que hace referencia a datos relativos. Finalmente, con los datos empíricos del test, se establece un punto de corte de compromiso.

Porcentaje de personas
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso. Método de Beuk Se trazan dos ejes: en abscisas el porcentaje de ítems que hay que contestar correctamente (primera de las preguntas); y en ordenadas el de sujetos que obtendrán la puntuación mínima para superar el test. 2. Se calculan las medias de las respuestas de los jueces a los dos preguntas y se obtiene el punto A. 3. Se obtiene la distribución empírica de las puntuaciones de los sujetos en el test 100 4. Se obtiene el punto A` haciendo pasar por A una recta de pendiente Sy/Sx (respuestas de los jueces a ambas cuestiones). A` Para ello, En primer lugar se trazan dos ejes: en abscisas el porcentaje de ítems que hay que responder correctamente. (precisamente la primera de las preguntas). A medida que el porcentaje de ítems aumenta para tener una competencia mínima, lógicamente el número de sujetos que lo pueden superar es menor. A continuación se calculan las medias de las respuestas de los jueces a las dos preguntas, que vienen representadas por los siguientes puntos, cuya intersección da lugar al punto A. En tercer lugar, se obtiene la distribución empírica de las puntuaciones de los sujetos en el test. Seguidamente, se obtiene el punto A`, haciendo pasar por A, una recta cuya pendiente es la desviación típica de las respuestas de los jueces a ambas preguntas. Finalmente, para obtener el punto de corte, se proyecta A`sobre el eje de abscisas lo que da lugar al porcentaje de ítems que un examinado debería responder correctamente. 5. Para obtener el punto de corte, se proyecta A` sobre el eje de abscisas. Porcentaje de personas A Distribución empírica Porcentaje de ítems 100

Transformación de puntuaciones para la interpretación en tests normativos

- Transformaciones lineales: escalas típicas; típicas derivadas.
TRANSFORMACIÓN DE PUNTUACIONES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS TRANSFORMACIÓN DE PUNTUACIONES EN TRN: La interpretación de las puntuaciones adquieren sentido, cuando se comparan con las puntuaciones obtenidas por el resto de sujetos de la muestra. Transformación de puntuaciones en test NORMATIVOS: Una vez obtenida las puntuaciones de los sujetos en un test, para facilitar la comprensión, las puntuaciones directas suelen transformarse en otro tipo de puntuaciones. Objetivo: expresar las puntuaciones directas de tal modo que hagan alusión a la ubicación del sujeto en el grupo. El otro gran bloque de test, son las test referidos a normas. En decir, donde la interpretación de las puntuaciones adquieren sentido, cuando se comparan con las puntuaciones obtenidas por el resto de sujetos de la muestra. Normalmente, una vez obtenida las puntuaciones de los sujetos en un test, para facilitar la comprensión, las puntuaciones directas suelen transformarse en otro tipo de puntuaciones, con el objetivo de expresarlas de tal modo que hagan alusión a la ubicación del sujeto dentro del grupo. A grandes rasgos, podemos diferenciar dos tipos de transformaciones: Las transformaciones lineales: entre las que encontramos dos tipos las escalas típicas; y las escalas típicas derivadas. Y las no-lineales; entre las que podemos destacar los percentiles; las típicas normalizadas y las normalizadas derivadas. - Transformaciones lineales: escalas típicas; típicas derivadas. - Transformaciones no-lineales: percentiles; típicas normalizadas; normalizadas derivadas.

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
1. Escalas típicas: una vez aplicado el test a toda la muestra, se calcula la media y desviación típica; a partir de lo que se obtienen las puntuaciones típicas (0, 1)  Indica el número de desviaciones típicas a las que se encuentra la puntuación del sujeto respecto a la media. Supone un cambio en el origen de la escala (la media); y de la unidad de medida (desviación típica). Transformaciones lineales: Dentro de las transformaciones lineales, de las más directas son las escalas típicas. Una vez, aplicado el test a toda la muestra, se calcula la media y desviación típica; a partir de lo que se obtienen las puntuaciones típicas, cuya distribución tiene media cero y desviación típica 1. Si se observa, se comprobará que se trata de una medida de error, ya que expresa en desviaciones típicas la distancia hasta la media. Suponen un cambio en el origen de la escala (la media) y de la unidad de medida, en este caso la desviación típica. Donde: es media de la muestra X es la puntuación directa Sx es la desviación típica de la distribución

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
Supongamos que hemos aplicado un test de razonamiento a una muestra de 400 sujetos. Sabemos que la media es de 18; y que la desviación típica es 3. Calcular las puntuaciones típicas de dos sujetos cuyas puntuaciones en el test fueron 16 y 21 respectivamente. 1. El primer sujeto se encuentra a 0.66 desviaciones típicas por debajo de la media. 2. Mientras que el segundo se encuentra a una desviación típica por encima del grupo. Así por ejemplo, imaginemos que hemos aplicado un test de razonamiento a una muestra de 400 sujetos. Sabemos que la media es de 18 y que la desviación típica es de 3. Y nos piden calcular las puntuaciones típicas de dos sujetos cuyas puntuaciones en el test fueron de 18 y 21 respectivamente. Si calculamos sus puntuaciones típicas encontraremos que el sujeto 1 obtiene una de –0.66; mientras que el sujeto 2 de 1. Ello indica que mientras que el sujeto 1 está por debajo de la media de su grupo de pertenencia, a 0.66 desviaciones típicas; el sujeto 1, se encuentra por encima de la media de su grupo a 1 desviación típica. Es decir, mediante las puntuaciones típicas ya podemos colocar en función de las puntuaciones de su grupo de pertenencia. Sin embargo, como se observa aquí presenta valores negativos y decimales. El principal inconveniente es que presenta valores negativos y decimales dificulta la interpretación

La transformación se puede expresar como:
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales 2. Escalas típicas derivadas: una vez realizada la transformación a escalas típicas, éstas se pueden transformar con media y desviación típica fijada por el usuario es posible evitar valores negativos y decimales. La transformación se puede expresar como: Donde: Y = es puntuación típica derivada a = es la media de las puntuaciones en la nueva escala b = es la desviación típica de la nueva escala Zx = es la puntuación típica en la escala original Otro tipo de transformaciones lineales, son las escalas típicas derivadas. Una vez realizada la transformación a escalas típicas, éstas se pueden transformar de nuevo linealmente, con media y desviación típica fijada por el usuario. Con ello, se consigue evitar números negativos y decimales, con lo que se hace más amigable la interpretación. La transformación, se puede expresar del siguiente modo, Donde; Y es la puntuación típica derivada a es la media de las puntuaciones en la nueva escala b es la desviación típica de la nueva escala Y Zx es la puntuación típica en la escala original.

Algunas escalas típicas derivadas de amplio uso son:
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales Algunas escalas típicas derivadas de amplio uso son: Escala Media Desviación típica Puntuaciones T de McCall (1939) 50 10 Pruebas de clasificación del ejército de EE.UU 100 20 Escala D Volviendo al ejemplo anterior (Z1=-0.66; Z2=1) Escala Y=media+SZx T de McCall (1939) T1= 50+(-0.66)10 = 43.4 T2= 50+(1)10 = 60 Pruebas de clasificación del ejercito de EE.UU Y1= 100+(-0.66)20 = 86.8 Y2= 100+(1)20 = 120 Escala D D1= 50+(-0.66)20= 36.8 D2= 50+(1)20= 70 Algunas de las escalas típicas derivadas de amplio uso son por ejemplo: Las puntuaciones T de McCall, que tienen 50 de media y 10 de desviación típica. O, las pruebas de clasificación del ejercito de EE.UU, cuya media está fijada en 100 y en 20 la desviación típica. O las escalas D; que tienen de media 50 y 10 de desviación típica. Volviendo al ejemplo anterior, la puntuación del sujeto 1, expresada en puntuaciones T de McCall, sería 43.4, mientras que la del sujeto 2 sería 60, por ejemplo.

- típicas normalizadas. - normalizadas derivadas.
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales Como se ha comprobado, las transformaciones lineales evitan el problema de los números negativos y de los decimales. Sin embargo, la aplicación de un test a dos muestras distintas, da lugar a distribuciones distintas y por tanto es necesario tener cautela a la hora de comparar las puntuaciones de un sujeto con respecto a una muestra concreta. Para ello podemos utilizar las transformaciones no lineales que implican una alteración de la forma de las distribuciones originales. - Rango percentiles. - típicas normalizadas. - normalizadas derivadas. Como se ha comprobado, las transformaciones lineales evitan el problema de los números decimales y negativos. Sin embargo, la aplicación de un test a dos muestras distintas, da lugar a distribuciones también diferentes, y por tanto, es necesario tener cautela a la hora de comparar las puntuaciones de un sujeto con respecto a otra muestra concreta. Por ello, las transformaciones no-lineales implican una alteración de la forma de las distribuciones originales. Dentro de las transformaciones no-lineales, encontramos los rangos percentiles; las típicas normalizadas; y las normalizadas derivadas.

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales Rango percentiles: aquella puntuación del test que deja por debajo un determinado porcentaje de casos del grupo normativo. Si por ejemplo, decimos que una puntuación 40 equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. . Son muy utilizadas para comunicar resultados. Sin embargo no constituyen una escala de intervalo, lo que implica que: - en diferentes regiones de la escala, una diferencia de 1 punto equivale a magnitudes distintas. las ganancias o pérdidas para un sujeto, así como las comparaciones entre sujetos no pueden analizarse en rango percentiles. no deben usarse cálculos aritméticos ni estadísticos, tales como medias o comparaciones de grupos. Una de las transformaciones no lineales más populares entre los usuarios de los tests, ya que la mayor parte de los manuales de test, la ofrecen como guía o norma, son los rangos percentiles. La fórmula para la obtención de los centiles, es la siguiente, y ya el alumno debería estar familiarizado con ello de asignaturas anteriores, como análisis de datos. Hemos de destacar que los percentiles, son muy utilizados para comunicar resultados. Sin embargo, hay que destacar que no constituyen una escala de intervalo, lo que implica que en diferentes regiones de la escala, una diferencia de 1 punto equivale a magnitudes distintas. En relación con el punto anterior, las ganancias o pérdidas para un sujeto, así como las comparaciones entre sujetos no pueden analizarse en rango percentiles. Y además no deben usarse cálculos aritméticos ni estadísticos, tales como la media o comparaciones entre grupos.

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales 2. Escalas típicas normalizadas: se obtienen a partir de los percentiles. Se definen como la puntuación típica que le corresponde a una puntuación empírica obtenida por un sujeto en un test suponiendo que la distribución es normal. Determinar los rangos percentiles correspondientes a cada una de las puntuaciones directas. Asumiendo que la variable se distribuye normalmente, buscar en la tabla de la normal los valores z correspondientes a cada uno de los porcentajes. Otro tipo de transformación no lineal, son las escalas típicas normalizadas, que se obtienen a partir de los percentiles. Concretamente, se definen como la puntuación típica que le corresponde a una puntuación empírica obtenida por un sujeto en un test en una distribución normal. Para hacer este tipo de transformación, en primer lugar: Hay que determinar los rangos percentiles correspondientes a cada una de las puntuaciones directas, tal y como se ha visto anteriormente. Y en segundo lugar, asumiendo que la variable se distribuye normalmente, se busca en la tabla de la distribución normal estandarizada los valores de z correspondientes a cada uno de los porcentajes. Siguiendo con el ejemplo anterior, si por decimos que una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90% de la sujetos de la muestra  si asumimos que dicha variable se distribuye normalmente, podemos buscar su puntuación z, asociada en las tablas que en este caso equivaldría a 1.28. Hay que destacar que la decisión de normalizar las puntuaciones no debe tomarse en todos los casos, ya que es desaconsejable cuando la distribución de las puntuaciones está muy alejada de la normalidad. Si por ejemplo, decimos que una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. Si asumimos que se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28.

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales 3. Escalas normalizadas derivadas (estaninos o eneatipos): las típicas normalizadas, presentan el inconveniente de los valores negativos y decimales. Ello, se puede superar mediante la transformación de las puntuaciones típicas normalizadas, a normalizadas derivadas. Estaninos: son una escala de valores enteros y positivos de 9 unidades (1 al 9). Son una transformación lineal de las típicas normalizadas con media 5 y desviación típica 2. E=5+2Zn Las escalas típicas normalizadas, presentan el inconveniente de los valores negativos y decimales. Ello, se puede superar mediante la transformación de las puntuaciones típicas normalizadas, a normalizadas derivadas. Una de las más conocidas son los estaninos; que son una escala de valores enteros y positivos de 9 unidades, que van del 1 al 9. Suponen una transformación lineal de las típicas normalizadas, con media 5 y desviación típica 2, y se calcula de acuerdo con la siguiente expresión. Siguiendo con el ejemplo anterior, si por ejemplo, decimos que una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. Si asumimos que se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas que en este caso equivale a Si ahora queremos calcular su estanino, aplicamos la fórmula y obtenemos un valor de 7.56, que por aproximación al entero más cercano es 8. Es decir, que el sujeto estaría en el estanino 8. Si por ejemplo, una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos. Si se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28. E=5+2(1.28)=7.56 8 Inconveniente: se incluye en el mismo eneatipo a sujetos con la misma puntuación

Edad mental (Binet-Simon):
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas Edad mental (Binet-Simon): Se seleccionan muestras de niños de distinta edad. Se les aplica un test (inteligencia por ejemplo). A cada grupo de edad se le hace corresponder la media obtenida Cociente intelectual: Se calcula la edad mental del sujeto. Se divide por su edad cronológica. Otro tipo de interpretación muy utilizada y que ha caído en desuso son las normas cronológicas. Las más utilizadas han sido: Edad mental (Binet-Simon): 1. Se seleccionan muestras de niños de distinta edad. 2. Se les aplica un test (inteligencia por ejemplo). 3. A cada grupo de edad se le hace corresponder la media obtenida Otro norma muy utilizada es el cociente intelectual que no coeficiente como se suele utilizar. En este caso, Se calcula la edad mental del sujeto. Y se divide por la edad cronológica y se multiplica por 100. Si el resultado es menor que 100 indica que el desarrollo intelectual está por debajo del cronológico. Si es igual a 100 significa que ambos coinciden. Y si es mayor que 100 significa que el desarrollo intelectual está por encima del cronológico. <100  desarrollo intelectual por debajo del que corresponde con su edad. =100 desarrollo intelectual y cronológico coinciden >100  desarrollo intelectual por encima del cronológico

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas
Inconvenientes: El significado de un año de edad mental no es constante con el desarrollo evolutivo de un niño. A medida que se crece la distancia entre años disminuye y se homogeneíza el desarrollo cognitivo  el CI es poco discriminativo entre adultos por ejemplo.

ESTABLECIMIENTO Y TIPO DE NORMAS:
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas ESTABLECIMIENTO Y TIPO DE NORMAS: Normas; son una descripción de la posición del sujeto respecto del grupo normativo. - el grupo normativo debe ser representativo de la población y tener un tamaño adecuado para proporcionar estimadores seguros. - el grupo normativo debe ser homogéneo (todos los sujetos sean miembros de la población objetivo). - como datos normativos se presentan todos los estadísticos descriptivos. Y en cuanto al tipo de escalas la más habitual es el rango percentil. Las normas, son una descripción de la posición del sujeto dentro del grupo normativo. Para que los estadísticos calculados representen adecuadamente a los sujetos. el grupo normativo debe ser representativo de la población y tener un tamaño muestral adecuado para proporcionar estimadores seguros. Además los miembros del grupo normativo deben proceder todos de la población de referencia. Finalmente, como datos normativos se suelen representar todos los estadísticos descriptivos como media, desviación típica, sesgo, etc. Y en cuanto al tipo de escalas, lo más habitual es utilizar el rango percentil.

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas Tipos de normas: Normas nacionales: es el tipo más frecuente, y se basan en muestras representativas a nivel nacional. Normas locales: son normas basadas en sub-poblaciones definidas sobre unidades geográficas limitadas. Como por ejemplo comunidades autónomas. Normas de usuarios y normas de conveniencia: son normas basadas en las puntuaciones de los sujetos a los que se les administra el test durante un período de tiempo determinado, pero sin consideraciones de muestreo. Son muy habituales en los test utilizados en la selección de personal. O en muchas otras ocasiones se basan en grupos de sujetos que simplemente son accesibles al constructor del test. En cuanto al ámbito de representación del grupo normativo, se suelen utilizar diferentes niveles y tipos de normas: Normas nacionales: es el tipo más frecuente, y se basan en muestras representativas a nivel nacional. Normas locales: son normas basadas en subpoblaciones definidas sobre unidades geográficas limitadas. Como por ejemplo comunidades autónomas. Normas de usuarios y normas de conveniencia: son normas basadas en las puntuaciones de los sujetos a los que se les administra el test durante un período de tiempo determinado, pero sin consideraciones de muestreo. Son muy habituales en los test utilizados en la selección de personal. O en muchas otras ocasiones se basan en grupos de sujetos que simplemente son accesibles al constructor del test.

Equiparación de puntuaciones

EQUIPARACIÓN DE PUNTUACIONES
la equiparación de puntuaciones de dos o más formas de tests se refiere a establecer una correspondencia entre sus puntuaciones, de tal modo que las puntuaciones de cualquiera de ellos pueda expresarse en términos de las del otro. Es decir, se trata de encontrar una transformación que permita expresar las puntuaciones de un test Y como función de las unidades de otro test X: Y*=f(X) La equiparación de puntuaciones de dos o más formas de tests se refiere a establecer una correspondencia entre sus puntuaciones, de tal modo que las puntuaciones de cualquiera de ellos pueda expresarse en términos de las del otro. Es decir, se trata de encontrar una transformación que permita expresar las puntuaciones de un test Y, como función de las unidades de otro test X. Las típicas preguntas que se tratan de responder mediante los procesos de equiparación, son del tipo ¿cuál sería la puntuación de Juan en el Test Y de inteligencia, habiendo obtenido una puntuación de 70 en el test X, que también mide inteligencia. ¿Cuál sería la puntuación de Juan en el test Y, que mide inteligencia, habiendo obtenido una puntuación de 70 en el test X (también de inteligencia)?

Condiciones de equiparación: Que los tests midan el mismo constructo; y con la misma fiabilidad. Que para cada grupo de examinados de idéntica aptitud, la distribución de frecuencias condicional sobre el test Y, después de la transformación (Y*), es la misma que la distribución de frecuencias condicional sobre el test X. Invarianza poblacional; es decir, la transformación será la misma independientemente del grupo en el que se obtenga. Simetría: la transformación es invertible, es decir los resultados serán los mismos obteniendo Y*=f(X); que X*=f(Y) Es poco probable que se cumplan las cuatro condiciones. Y aunque en teoría es posible construir dos formas que midan el mismo constructo y sean igualmente fiables, es improbable que lo sean en todos los niveles de aptitud.

Equiparación horizontal, frente a vertical: la equiparación horizontal hace referencia a que ambos tests son iguales en dificultad. Sin embargo, esto no siempre ocurre, y nos encontramos ante el problema de la equiparación vertical, es decir, cuando los test miden el mismo rasgo pero con distinto nivel de dificultad. Un concepto que es importante distinguir es la equiparación vertical frente a la horizontal. Como hemos comentado anteriormente, la horizontal hace referencia a que ambos test son iguales en cuanto a dificultad. Sin embargo, esto no siempre ocurre, y nos encontramos ante el problema de la equiparación vertical, en que ambos test, a pesar de medir el mismo rasgo difieren en cuanto a niveles de dificultad.

Diseños de equiparación:
EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación Diseños de equiparación: Diseños de un solo grupo: se administran las dos formas del test, al mismo grupo de sujetos (una tras otra). - Inconveniente de que existan diferencias debido al cansancio, o al efecto del orden. Para evitarlo se puede utilizar diseños de un solo grupo contrabalanceado dividir a la muestra en dos sub-grupos y aplicar ambas formas pero en orden inverso. Existen varios tipos de diseños de recogida de datos. Entre ellos, uno de los más utilizados es el diseño de un solo grupo: para aplicarlo, se administran las dos formas del test, al mismo grupo de sujetos. Sin embargo, presenta el inconveniente de que las diferencias encontradas puedan ser debidas al cansancio de los sujetos o al efecto del orden de aplicación de las pruebas, para evitar esto último, una posibilidad es utilizar diseños de un solo grupo contrabalanceado, es decir, la muestra se divide en dos, y en cada mitad se aplican los tests en un orden distinto. Es decir, en una submuestra, primero se aplica el X y luego el Y; y en la otra mitad, primero el Y y a continuación el X.

EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación
2. Diseños de grupos equivalentes: extraen de la población y de forma aleatoria dos muestras de sujetos, y a cada muestra se le aplica una forma del test. Es decir, las dos formas del test son administradas cada una a un grupo de sujetos. Ventaja; se evitan los efectos de la fatiga, aprendizaje u orden de aplicación. Inconveniente: ambos grupos han de ser equivalente en la aptitud que mide el test. Y requiere amplios tamaños muestrales. El segundo tipo de diseños a destacar, son los diseños de grupos equivalente, en ellos, se extraen de la población y de forma aleatoria dos muestras de sujetos, y a cada una se le aplica una forma del test. Es decir, las dos formas del test son administradas cada una a un grupo de sujetos. Presenta la ventaja de que se evitan los efectos de la fatiga, aprendizaje u orden de aplicación. Y tienen el inconveniente de que ambos grupos han de ser equivalente en la aptitud que mide el test. Y además requieren amplios tamaños muestrales.

EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación
3. Diseños de grupos no equivalentes con ítems comunes o diseño de anclaje (es uno de los diseños más utilizados): En cada muestra de sujetos se administra solamente una forma del test, con la peculiaridad de que en ambas muestras se administra un test común (Z, test de anclaje), que permite establecer la equivalencia entre los test a equiparar. - Test de anclaje interno: ítems comunes que aparecen intercalados entre el resto de ítems (se consideran en la puntuación total): ítems de anclaje. - Test de anclaje externo: los ítems comunes aparecen formando un test independiente (no se consideran en la puntuación total)  test de anclaje. En cuanto al nº de ítems comunes; al menos el 20% del test total. Otro tipo de diseños, son los de grupo no equivalente con ítems comunes o diseño de anclaje, siendo éste uno de los mas utilizados: Consisten, en que en cada muestra de sujetos se administra solamente una forma del test, con la peculiaridad de que en ambas muestras se administra un test común (Z, o test de anclaje), que permite establecer la equivalencia entre los test a equiparar. Encontramos dos tipos de test de anclaje: - test de anclaje interno: compuesto por ítems comunes que aparecen intercalados entre el resto de ítems (éstos se consideran en la puntuación total), y se les denomina ítems de anclaje. - test de anclaje externo: en este caso, los ítems comunes aparecen formando un test independiente (y en este caso no se consideran en la puntuación total); y se le denomina test de anclaje

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación
Métodos de equiparación: una vez obtenidos los datos mediante los diseños vistos anteriormente, es necesario obtener las puntuaciones mediante distintos métodos estadísticos. Método de la media: se hace corresponder las medias de los test a equiparar. Sean X e Y dos tests distintos, para toda puntuación X podemos establecer que: Donde: X* es la puntuación del test Y, equivalente a una del test X. X es la puntuación del test X. es la media del test X e Y, respectivamente. Una ve que hemos obtenidos los datos mediante los diseños de equiparación, vistos anteriormente, es necesario obtener las puntuaciones mediante distintos métodos estadísticos. Uno de ellos, es el método de la Media; en el se pretende hacer corresponder las medias de los tests a equiparar. Así por ejemplo, sean X e Y dos tests distintos cuyas puntuaciones queremos equiparar, entonces, para toda puntuación X podemos establecer que, X asterisco, es igual a la puntuación del test Y, que a su vez es igual a la puntuación en el test X menos la media del test X, más la media del Y.

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método de la media 1. Supongamos dos test X e Y, cuyas medias son, respectivamente, 65 y 70. Un sujeto ha obtenido una puntuación de 60 puntos en el test X ¿qué puntuación le correspondería en el test Y? Así por ejemplo, supongamos dos test X e Y, cuyas medias son respectivamente, 65 y 70. Y un sujeto ha obtenido una puntuación de 60 puntos en el test X ¿qué puntuación le correspondería en el test Y? Si aplicamos la fórmula, encontramos que un sujeto que en el test X, ha obtenido una puntuación de 60, le correspondería una de 65 en el test Y. Es decir, el origen de la escala se pone en la media del test al cual se desea equiparar la puntuación. Según los datos, un sujeto que en el test X ha obtenido una puntuación de 60, le correspondería una de 65 en el test Y.

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal
2. Método lineal: se basa en la equiparación de aquellas puntuaciones directas que tienen la misma puntuación típica. Es decir, una determinada puntuación de Y, es equivalente a una de X, si ambas puntuaciones tienen idéntica puntuación Z, con lo que ZX= ZY Donde: X* es la puntuación del test Y, equivalente a una del test X. X es la puntuación del test X. es la media del test X e Y, respectivamente. Sx y Sy es la desviación típica de X e Y respectivamente

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal
Si hubiéramos utilizado un diseño de un solo grupo, en el que se administran ambos test. La expresión sería la siguiente: Por último, si hubiéramos utilizado un diseño de anclaje. La expresión sería la siguiente: Si hubiéramos utilizado un diseño de un solo grupo, en el que se administran ambos test. La expresión sería la siguiente. Y por último, si hubiéramos empleado un diseño de anclaje, la expresión sería la que aparece a continuación.

Métodos de equiparación
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil Métodos de equiparación 3. Método equipercentil: es el método más habitual, consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales. 1. Calcular en cada test las puntuaciones percentiles que corresponden a cada una de las puntuaciones de ambos test. 2. Representar gráficamente las dos distribuciones de percentiles. 3. Obtener las puntuaciones equivalente en los dos test (X e Y) a partir del gráfico anterior. El tercer método que presentaremos es el método equipercentil, se trata del método más habitual, y consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales. Para ello, los pasos a seguir son los siguientes: Calcular en cada test, las puntuaciones percentiles que corresponden a cada una de las puntuaciones de ambos test. Representar gráficamente las dos distribuciones de percentiles. Obtener las puntuaciones equivalentes en los dos test, a partir del gráfico anterior.

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil 3. En la tabla adjunta se presentan las puntuaciones percentiles correspondientes a un grupo de sujetos en dos formas (X e Y) de un test de razonamiento compuesto por 10 ítems. Puntuación Percentil en X Percentil en Y 1 3 2 5 4 10 14 6 20 26 8 29 40 43 57 12 61 72 75 82 16 87 91 18 95 97 99

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil Representamos gráficamente ambas distribuciones: 1. Eje de abscisas puntuaciones de X e Y; eje de ordenadas los percentiles. Test X Test Y 120 2. Representamos la curva correspondiente a cada test. 100 3. Obtenemos las puntuaciones equivalentes en ambos tests. 80 percentil 60 - Observamos, que una X=10; le corresponde, aproximadamente, una puntuación equivalente X*=8. Este proceso se sigue con el resto de las puntuaciones. A continuación, a partir de la tabla, representamos gráficamente las dos distribuciones, y a partir de ahí, obtenemos las puntuaciones equivalentes en los dos test X e Y. Así por ejemplo, observamos que una puntuación en el test X = 10, equivale aproximadamente, con una puntuación de 8 en X*, es decir, en el test Y. Este proceso se sigue con el resto de las puntuaciones. 40 20 1 2 4 6 8 10 12 14 16 18 20 puntuación directa

Documentación del test

Especificación del test. Descripción del test. La justificación.
ELABORACIÓN DE LA DOCUMENTACI´NO QUE ACOMPAÑA AL TEST. EL MANUAL DEL TEST: Existe la necesidad por parte del constructor del test de dar información a los usuarios para que puedan dar una significación adecuada a las puntuaciones obtenidas por un sujeto en el test ELABORACIÓN DEL MANUAL DEL TEST. Para Yela (1984), la información a incluir sería la misma que la que se incluiría en un informe científico: Especificación del test. Descripción del test. La justificación. Referencias bibliográficas. Cuando se elabora un test, existe la necesidad por parte del constructor de dar información a los usuarios para que puedan dar una significación e interpretación adecuada a las puntuaciones obtenidas por un sujeto en el test. todo ello, hace referencia a la elaboración del manual del test. En este sentido, Yela entiende que la información que se debería contemplar en el manual del test responde a la que se incluiría en un informe científico: en concreto hace referencia a la especificación del test; la descripción; la justificación y referencias bibliográficas.

ELABORACIÓN DE LA DOCUMENTACIÓN QUE ACOMPAÑA AL TEST.
Especificación del test: denominación y clasificación del test (tipo de constructo que evalúa); tipo de material (impreso y manipulativo); y al método de administración (individual o colectiva). Descripción del test: 2.1. Introducción donde se explique el objetivo del test; su relación con otros tests; y sus antecedentes y desarrollo del test. 2.2. Explicitar el campo de aplicación (aspectos psicológicos que se pretende estudiar). 2.3. Instrucciones de aplicación, y tiempos de los que se dispone para la ejecución de cada una de las partes. 2.4. Indicar la forma de puntuar, para ello, se incluirán plantillas con soluciones; así como ejemplos comentados. 3. La justificación: incluye los datos cuantitativos que justifican el uso del test (fiabilidad, validez y tipificación del test). 4. Referencias bibliográficas. Ejemplo: manual BFQ-N Cuando se elabora un test, existe la necesidad por parte del constructor de dar información a los usuarios para que puedan dar una significación e interpretación adecuada a las puntuaciones obtenidas por un sujeto en el test. todo ello, hace referencia a la elaboración del manual del test. En este sentido, Yela entiende que la información que se debería contemplar en el manual del test responde a la que se incluiría en un informe científico: en concreto hace referencia a la especificación del test; la descripción; la justificación y referencias bibliográficas. Así como ejemplo, el manual del cuestionario de los cinco grandes de personalidad, presenta el siguiente manual, con la información estructurada de la siguiente forma: 1. En primer lugar, aparece una ficha técnica

VALORACIÓN DE LA TEORIA CLÁSICA DE LOS TEST
VALORACIÓN DE LA TCT: Los procedimientos vistos se han desarrollado bajo la TCT, que ha sido y sigue siendo uno de los modelos psicométricos mas influyentes dentro del campo de la medición en Psicología. - Ventajas: Sencillez, claridad y flexibilidad de sus conceptos Partiendo de supuestos mínimos, proporciona solución a una gama amplia de problemas de medición. - Limitaciones: Los supuestos no se pueden comprobar empíricamente El supuesto de error de medida constante para los diferentes nivel de habilidad es poco plausible Las propiedades del test y las puntuaciones de los sujetos no son invariantes. Concepción indiferenciada del error de medida Todos los procedimientos vistos hasta ahora se ha desarrollado bajo la Teoría Clásica de los test. Ha sido, y sigue siendo uno de los modelos psicométricos más influyentes dentro del campo de la medición en psicología. Las principales ventajas de la TCT son: -La sencillez, claridad y flexibilidad de sus conceptos -y que, partiendo de supuestos mínimos proporciona solución a una gama amplia de problemas de medición. Por otro lado, sus principales limitaciones son: - que los supuestos no se pueden comprobar empíricamente, por lo que no podemos evaluar el ajuste del modelo a los datos. -el supuesto de error de medida constante para los diferentes niveles de habilidad es poco plausible. -Las propiedades del test y las puntuaciones de los sujetos no son invariantes, Por último, la TCT presenta una concepción indiferenciada del error de medida, sin especificar y los múltiples factores que lo originan.

A MODO DE SÍNTESIS Fiabilidad, validez, y análisis de ítems Evaluación de los sujetos Asignación de puntuaciones (azar y omisiones). - Créditos para el conocimiento parcial (ponderación de confianza; responder hasta acertar; ponderación de las opciones). Interpretación de las puntuaciones (TRN; y TRC) TRC, y establecimiento de puntos de corte: Métodos centrados en el test (ítem como unidad de análisis). Métodos centrados en las personas. Métodos de compromiso. TRN, y transformación de puntuaciones: Lineales (típicas; y típicas derivadas). No-lineales (percentiles; típicas normalizadas; normalizadas derivadas) En los temas anteriores, nos hemos detenido en conceptos como la fiabilidad, validez, y análisis de los elementos de un test. El primero hacía referencia a la precisión de la medida, el segundo al significado de la misma. Y vimos cómo el análisis de ítems constituía uno de los elementos fundamentales para la construcción de buenos tests  por ello, una vez que el test se ha construido y se ha administrado a una muestra de sujetos, el siguiente paso es la evaluación de los sujetos. Para ello: En primer lugar, vimos los distintos procedimientos para asignar una puntuación una vez que el sujeto ha respondido al test. Destacamos la necesidad de controlar factores como que los sujetos acierten por azar, y el hecho de que omitan ítems. También vimos que no todos los sujetos que aciertan un ítem, tienen por qué tener el mismo conocimiento del mismo, dicho problema se abordaba desde el concepto de créditos de conocimiento parcial. Dentro del que existen distintos procedimientos para controlarlo, como la ponderación de confianza; responder hasta acertar; y la ponderación de las opciones. 2. En segundo lugar, vimos la forma en que se podían interpretar las puntuaciones obtenidas por los sujetos. Así, por un lado estaban las interpretaciones referidas a la norma, que se posiciona al sujeto dentro de su grupo de referencia; y por otro las interpretaciones referidas al criterio en que se determina si el sujeto domina un determinado dominio que se está evaluando. 3. Dentro de los TRC, destaca el hecho de establecer un punto de corte que permita discriminar a los sujetos en dos categorías. Y para ello, vimos que existían métodos centrados en el test (más concretamente en sus ítems); métodos centrados en las personas; y métodos de compromiso que tratan de conjugar ambos criterios. 4. En cuarto lugar, dentro de los TRN, destacaba la necesidad de transformar las puntuaciones para facilitar la interpretación a personas no familiarizadas con la psicometría. Destacan dos tipos de transformaciones, las lineales, que no cambian la forma de la distribución, y entre las que encontramos las típicas y las típicas derivadas; y las No-lineales que sí cambian la forma de la distribución, y entre las que comentamos los percentiles, las típicas normalizadas; y las normalizadas derivadas.

A MODO DE SÍNTESIS 5. Equiparación de puntuaciones.
Diseños: un solo grupo; grupos equivalentes; y anclaje. Métodos: media; lineal; equipercentil. 6. Manual del test: especificación; descripción; justificación; y bibliografía. 7. Valoración de la TCT: ventajas, y limitaciones. 5. En quinto lugar, vimos la equiparación de puntuaciones, cuya necesidad surge ante cuando deseamos saber cuál sería la puntuación de un sujeto en un test Y, habiendo obtenido una determinada puntuación en otro test (X) que mide el mismo rasgo. Para ello, vimos que existían distintos diseños para obtener los datos, como el de un solo grupo, de grupos equivalentes, y de anclaje. Y distintos métodos como el de la media, el lineal, y el equipercentil. 6. En sexto lugar, vimos que una vez desarrollado el test, es necesario elaborar un material que lo acompañe para que cualquier usuario lo pueda utilizar correctamente. En este sentido, y siguiendo a Yela, los apartados que debería incluir son los que también contempla cualquier documento científico, como la especificación, la descripción, justificación y referencias bibliográficas. 7. Y por último, dado que todos los procedimientos vistos se basan en la TCT, destacamos sus principales ventajas y limitaciones. Lo que nos servirá para introducir los siguientes temas dedicados a la TRI. En ellos abordaremos los conceptos básicos y sus principales aportaciones y aplicaciones en la medida psicológica. E

BIBLIOGRAFÍA COMENTADA
1. Barbero, I., García, E. Vila, E., y Holgado, F.P. (2010). Psicometría: Problemas resueltos. Madrid: Sanz y Torres. Se trata de un libro de ejercicios y problemas en el que se incluye el desarrollo de la solución. El alumno podrá completar desde un punto de vista aplicado los conceptos y contenidos vistos en la parte teórica; así como adquirir las destrezas necesarias para la resolución de problemas. 2. Barbero, I. (Coord.) , Vila, E. y Holgado, F.P. (2010). Psicometría. Madrid: Sanz y Torres. El capítulo 9 puede servir para preparar los contenidos relacionados con la asignación y transformación de puntuaciones. 3.Martínez Arias, R. (1995). Psicometría: Teoría de los Tests Psicológicos y Educativos. Madrid: Síntesis. En el Cap. 20 se tratan los principales aspectos relacionados la asignación de puntuaciones, sus transformaciones; y presenta los principales procedimientos de equiparación. Todo ello está ejemplificado abundantemente.

Tema 7 Baremación, estandarización y equiparación de puntuaciones

Presentaciones similares

Presentación del tema: "Tema 7 Baremación, estandarización y equiparación de puntuaciones"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Tema 7 Baremación, estandarización y equiparación de puntuaciones

Presentaciones similares

Presentación del tema: "Tema 7 Baremación, estandarización y equiparación de puntuaciones"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback