La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1  INTRODUCCION A LOS  TESTS DE HIPÓTESIS.   INTRODUCCION:   Los profesionales de nuestro medio saben que las “ estadísticas” no son como el común.

Presentaciones similares


Presentación del tema: "1  INTRODUCCION A LOS  TESTS DE HIPÓTESIS.   INTRODUCCION:   Los profesionales de nuestro medio saben que las “ estadísticas” no son como el común."— Transcripción de la presentación:

1 1  INTRODUCCION A LOS  TESTS DE HIPÓTESIS

2   INTRODUCCION:   Los profesionales de nuestro medio saben que las “ estadísticas” no son como el común de las personas lo interpretan, es decir, como una colección de largas cantidades de información cuantitativa a los que podemos añadir los parámetros que resumen dicha información, como por ejemplo los promedios, las proporciones y los totales.   Otras personas entienden las “estadísticas” tal como las definen los periodistas deportivos, es decir, como los resúmenes que se muestran en la TV entre cada set de un partido de Tenis: cantidad de “ aces”, de errores no-forzados, pelotas ganadoras, etc., etc., etc.   Esto mismo se repite en los partidos de futbol, y la información que entregan también la denominan “estadísticas”.  Y esta forma errada de denominar las “tablas resúmenes” de los partidos pasó a formar parte del vocabulario de muchas personas.   Afortunadamente, la realidad es muy diversa y así es como encontramos a profesionales destacados en Estadísticas, que se preocupan tanto del aspecto docente como de las investigaciones prácticas. 2

3   En este último terreno, tenemos a los investigadores en Estudios de Opinión Pública, en Estudios de Mercado, en investigaciones biológicas, en la agricultura y en muchos otros campos que sería muy largo de enumerar.   Obviamente en cada una de estas investigaciones participan - o debieran participar- en el diseño de estos estudios, junto con el Estadístico, otros profesionales relacionados con esta área de la investigación, como Sociólogos, Psicólogos e Ingenieros Comerciales.  Por el lado de los clientes o usuarios de estos estudios, deben participar aquellos profesionales interesados en los resultados, como por ejemplo Gerentes de Marketing, Ingenieros de todas las ramas, dirigentes políticos, Diputados, Senadores, Ministros, cientistas políticos, periodistas, etc.   Es por ello que he sentido el imperativo de redactar este documento cuya pretensión consiste en ayudar a aquellos que lo lean, a aprovechar las herramientas que las ciencias estadísticas ponen en sus manos, e intentar obtener la mayor información relevante posible del conjunto de tablas obtenidas del procesamiento de estudios basados en muestras probabilísticas.   Este documento pretende centrarse en análisis estadísticos denominados en términos generales “TESTS NO PARÁMETRICOS”, los que son aplicables a los resultados de estudios y encuestas diseñadas e implementadas en terreno en base a muestreo probabilístico.   Las muestras en las que se basan los resultados pueden ser obtenidas por el diseño conocido como “muestreo aleatorio simple” o a través de muestras complejas como por ejemplo: estratificadas (con afijación proporcional o no), monoetápicas o multietápicas, de conglomerados, con probabilidades proporcionales al tamaño o equiprobables (muestras unifásicas o multifásicas, etc.) 3

4  La única condición para poder trabajar con estos diseños muestrales complejos, generalmente de conglomerados, consiste en ser capaces de calcular el “efecto del diseño” lo que involucra conocer el número de entrevistas por conglomerado (generalmente manzanas, en los estudios más comunes) y estar en condiciones de estimar el coeficiente de correlación intraclase de las variables relevantes (sujetos potenciales de análisis no-paramétrico).   El objetivo de estos cálculos consiste en (cuando el muestreo utilizado además de ser probabilístico, es complejo) poder traducir el tamaño nominal (entrevistas efectivas de dicha muestra), al tamaño “efectivo”, es decir, al tamaño muestral que correspondería si el diseño hubiese podido realizarse con un muestreo aleatorio simple.   Esta exigencia se debe a que las técnicas de análisis no-paramétrico se basan todas en que la(s) muestra(s) con la que se está trabajando, es (son) de ese diseño, es decir aleatorio simple.   El problema estriba en que la mayoría de los estudios, especialmente los de Opinión Pública, están basados en muestreos complejos, siendo prácticamente imposible en estos casos utilizar las técnicas de análisis que suponen que los datos a analizar provienen de un diseño aleatorio simple.   En términos muy generales, la estadística moderna se preocupa principalmente de la inferencia estadística.  La inferencia estadística, a su vez, se preocupa principalmente de dos tipos de problemas : la estimación de parámetros poblacionales y los tests de hipótesis.   Es con estos últimos con los que nos preocuparemos principalmente en este documento. 4

5   En la inferencia estadística, nuestro objetivo principal es obtener conclusiones acerca de un grupo grande de sujetos : Universo o Población (compuesto en último término por lo que llamamos generalmente “unidades de análisis”) a partir del examen de un número reducido de estas unidades.   Supongamos por un momento, que el objetivo de un estudio es el de conocer cual de varias variedades de paltas prefieren los consumidores chilenos, y en qué proporción prefieren cada una.  Obviamente, informalmente, uno podría sacar conclusiones, parándose en un determinado Supermercado al lado del stand de las paltas, e ir anotando cuantas unidades se están llevando los clientes de cada variedad.  Saque usted la confianza que se puede depositar en estos resultados.  ¿Se atrevería a sacar conclusiones basándose en el resultado obtenido en un Supermercado determinado, en un día determinado, con las compras efectuadas por el determinado grupo de consumidores que compró paltas en ese día ?   La lógica de los procedimientos estadísticos nos proporciona las herramientas que nos permiten dar cumplimiento a nuestro deseo de ser capaces de inferir al Universo basados solamente en una muestra.  Estas herramientas las encontramos en las Teorías y Técnicas del Muestreo Probabilístico - el que a su vez está basado en la teoría de las Probabilidades - y en los tests de hipótesis.   En estos últimos nos concentraremos, tras una breve descripción de cómo funcionan estos tests (también llamados Docimasias de Hipótesis)  El lector que desee conocer más detalles sobre el “efecto del diseño” es invitado a documentarse en el texto “Survey Sampling” de Leslie Kish,  o en el texto “Analysis of Complex Surveys” de Skinner, Holt and Smith 5

6  TESTS NO – PARAMETRICOS   El procedimiento normalmente utilizado envuelve varios pasos.   A continuación se listan estos pasos en su orden cronológico   1.- Establezca la hipótesis nula (H 0 ) y su alternativa (H 1 ). Decida qué datos debe recolectar y bajo qué condiciones.  Escoja un test estadístico (con su modelo estadístico asociado) para testear H 0   2.-De entre los varios tests que podrían usarse dado un determinado diseño de investigación, elija aquel test cuyo modelo se aproxima lo más posible a las condiciones de la investigación en términos de los supuestos en los cuales el test se basa.   3.- Especifique un nivel de significancia ( α ) y, si el diseño muestral es complejo, calcule el tamaño muestral equivalente al necesario en muestreo aleatorio simple para lograr la misma precisión ( error standard).  4.- Encuentre la distribución estadística bajo el supuesto que la hipótesis nula es verdadera 6

7   5.- En base a los puntos 1, 2 y 3 precedentes defina la región crítica (región de rechazo de la Hipótesis Nula) del test estadístico   6.- Recoja la información en terreno. Usando la información recogida en la(s) muestra(s) compute el valor obtenido en el test. Si dicho valor se encuentra dentro de la región crítica (de rechazo), la decisión a tomar es la de rechazar la Hipótesis Nula. Si, por el contrario, el valor se encuentra fuera de la región crítica la decisión a tomar es que la Hipótesis Nula no puede ser rechazada al nivel de significancia escogido.   En el cuerpo de la presentación en Power Point que acompaña a la actual se despliega una serie de tests estadísticos, cada uno de los cuales se presenta con su programa de evaluación para permitir implementar el test y un ejemplo numérico útil para facilitar la comprensión del respectivo test.   Cada uno de estos tests cumple con los 6 pasos enunciados en los párrafos anteriores.  Un entendimiento básico de la razón de ser de cada uno de estos pasos, es esencial para comprender el papel de los valores obtenidos en el test de hipótesis respectivo.   Nota : los programas estadísticos presentados en el presente documento, fueron elaborados utilizando el lenguaje de programación “ Mathematica ” de Wolfram Research. A los interesados en entender el funcionamiento de cada test o en evaluar sus propios datos a través de nuestro servicio especial de tests estadísticos, se les recomienda bajar de Internet el programa lector gratuito “CDFPlayer” de la página Web http ://www.wolfram.com/cdf-player/http ://www.wolfram.com/cdf-player/  7

8  PASO 1 : LA HIPOTESIS NULA Y LA HIPOTESIS ALTERNATIVA   El primer paso en el proceso de toma de decisiones, consiste en establecer la hipótesis nula (H 0 ). La hipótesis nula es una hipótesis de “no efecto” y es usualmente formulada con el propósito explícito de ser rechazada. En otras palabras es la negación de la hipótesis que a nosotros nos interesa averiguar (H 1 ). Si la Hipótesis Nula logra ser rechazada, entonces se acepta la Hipótesis Alternativa, la cual es justamente la que hemos establecido como el objetivo de nuestra investigación. En realidad, la hipótesis Alternativa (H 1 ) es la interpretación matemática de nuestra hipótesis de investigación.  Por ejemplo, si deseamos testear nuestro supuesto de que la media de determinada variable es distinta a la media de la misma variable pero de otro universo, entonces podemos establecer como Hipótesis Alternativa H 1 :   μ 1 ≠ μ 2  Y la Hipótesis Nula H 0 quedaría como   μ 1 = μ 2   En el caso de que los datos empíricos recolectados en ambas muestras nos den un valor para el test respectivo que permita rechazar la Hipótesis Nula, aceptamos la Hipótesis alternativa, concediendo eso sí de que existe una probabilidad α de estar equivocados al aceptar la Hipótesis Alternativa de que ambas medias son distintas.  Por ejemplo, si antes de implementar el test elegimos a α (el nivel de significancia) como 0.05, estamos diciendo que aceptamos el riesgo de equivocarnos con una probabilidad del 5% al aceptar la Hipótesis Alternativa, si es que el valor obtenido del test cae en la Región Crítica ( también llamada de rechazo). 8

9  En otras palabras, estamos diciendo que si bien obtuvimos de las muestras las estimaciones de las medias μ 1 y μ 2 lo suficientemente separadas entre sí como para que el valor de el test caiga dentro de la Región de Rechazo, y por eso rechazamos la H 0 y aceptamos la H 1 ( que las medias son distintas) es probable que ambas medias sean iguales en los Universos 1 y 2 y que por esas cosas de las probabilidades obtuvimos un resultado que sugería que no eran iguales.   Puede darse también el caso que la Hipótesis Alternativa diga que   μ 1 > μ 2   En este caso, la H 0 sería   μ 1 ≤ μ 2  Debemos señalar que en el caso de rechazar la hipótesis nula no podemos afirmar que la Hipótesis Alternativa es verdadera.   Sólo podemos decir que aceptamos la H 1, pero en términos probabilísticos, es decir que estamos conscientes que existe una probabilidad α de estar equivocados en nuestra aceptación de H 1 9

10  PASO 2 : ELECCION DEL TEST ESTADISTICO   El campo de la estadística se ha desarrollado a tal nivel, que ahora contamos con una batería de tests alternativos que se adaptan a casi cualquier tipo de diseño de investigación, como lo demostraremos más adelante en la Tabla resumen de tests que presentaremos.   Cada uno de estos tests es capaz de proporcionarnos un resultado que permita minimizar nuestra probabilidad de cometer un error al tomar una decisión acerca de una hipótesis.   Puesto que disponemos de una batería de tests a nuestra disposición, necesitamos contar con un criterio racional en la selección del test que vamos a utilizar.   Este es el segundo paso del que habíamos hablado en nuestra lista de 6 pasos 10

11  PASO 3 : NIVEL DE SIGNIFICANCIA Y TAMAÑO MUESTRAL   Una vez que se han establecido las hipótesis nula (H 0 ) y alternativa (H 1 ), y además se procedió a seleccionar el test más apropiado a las circunstancias, el próximo paso consiste en especificar el nivel de significancia ( α ) y a especificar el tamaño muestral (n).   Mientras más importantes o altos los costos a pagar por un error en nuestra toma de decisión, en el sentido de rechazar la Hipótesis Nula cuando ella es la hipótesis correcta  más baja debería ser la probabilidad α de cometer ese error ( llamado error del tipo 1 ), en otras palabras, α debería ser establecida por el investigador o por el usuario principal de los resultados, en un nivel inferior, como por ejemplo 0.01 e incluso en 0.001.  Este nivel tan bajo de α se justifica especialmente en experimentos biológicos, cuando el propósito de la investigación podría ser el detectar si un nuevo medicamento es superior a los medicamentos utilizados hasta la fecha. Un error en la decisión puede costar millones si se acepta, erróneamente, la Hipótesis alternativa, la que supone que la medicina nueva es superior a la antigua. Por lo tanto, estableciendo a priori la probabilidad α en un valor muy bajo, en igual medida se reduce la probabilidad de cometer un error del tipo 1, es decir, de rechazar la Hipótesis Nula, erróneamente, cuando ella es la hipótesis verdadera.   Es importante enfatizar que el valor de α debe ser establecido previo a la recolección de los datos 11

12  Es interesante señalar que existe no solamente el error de tipo 1, que ocurre cuando rechazamos erróneamente la Hipótesis Nula y, en forma equivalente, aceptamos erróneamente la Hipótesis Alternativa, sino que también existe el error de tipo 2, que es el que ocurre cuando, erróneamente, aceptamos la Hipótesis Nula cuando ésta es falsa y, en consecuencia, rechazamos erróneamente la Hipótesis Alternativa.   El poder de un test se simboliza por 1- β y consiste en la probabilidad de rechazar H 0 cuando realmente corresponde rechazarla por ser esta hipótesis falsa. Indudablemente mientras más bajo el valor de β, más alto el poder, lo que es muy conveniente, pero generalmente para lograrlo, se debe aumentar el tamaño muestral. En otras palabras, mientras más se aumente el tamaño muestral, más aumenta el poder del test   La probabilidad de cometer este error de tipo 2, se simboliza por la letra griega β, tal como la probabilidad de cometer un error del tipo 1 se simboliza con la letra griega α.  12

13  Resumimos a continuación lo dicho hasta ahora   1.- El nivel de significancia α de un test es la probabilidad con que, cuando la hipótesis H 0 es cierta, el test estadístico nos dará como resultado un valor que nos llevará a rechazar H 0 incorrectamente, esto es, el nivel de significancia α indica la probabilidad de cometer un error de tipo 1   2.- β es la probabilidad de que el test estadístico nos de cómo resultado un valor que nos lleve a aceptar la hipótesis nula H 0 a pesar de ser ésta falsa, esto es, β es la probabilidad de cometer un error de tipo 2   3.- El poder de un test, 1- β es la probabilidad de rechazar la hipótesis nula H 0 cuando ésta es falsa (y por lo tanto debería ser rechazada).   4.- El poder es función del test estadístico elegido   5.- En general, el poder de un test crece a medida que el tamaño muestral a utilizar crece.  13

14  PASO 4 : LA DISTRIBUCION MUESTRAL   Una vez que es elegido determinado tipo de test a usar con el conjunto de datos recopilados, se debe determinar la distribución de muestreo del test estadístico.   La distribución de muestreo (o distribución muestral), es una distribución teórica (como la curva Normal, el Chi- Cuadrado, la “t” de Student, etc.).   Esta es la distribución que obtendríamos si extrajéramos TODAS las muestras aleatorias diferentes del mismo tamaño, posibles de extraer de un mismo Universo. 14

15  PASO 5 : LA REGION DE RECHAZO   Debemos señalar aquí que el valor de α que aparentemente nos indica la probabilidad de obtener un valor como resultado de un test bajo la Hipótesis Nula, no debe ser considerada como la probabilidad de ese valor exactamente, sino de ese valor más la probabilidad de ocurrencia de cualquier valor más extremo que ese o más inconsistente aún con la Hipótesis nula H 0.   Así por ejemplo, en el caso de la Distribución Normal, si el nivel de significancia α se fija en 0.05 (Probabilidad del 5% de cometer un error del tipo 1), y la Hipótesis Alternativa establece, por ejemplo, que la media del Universo 1 es DISTINTA a la media del Universo 2, es decir,   μ 1 ≠ μ 2  la Hipótesis Nula H 0 quedaría como   μ 1 = μ 2 15

16  Entonces, por ser simétrica la Distribución Normal, se procede a dividir el valor de α en dos, vale decir, 0.025 (2,5%) y se aplica este espacio en cada cola de la distribución, siendo el valor z correspondiente de 1,96. Esto significa que si el valor del test, que se supone en este ejemplo debiera darnos el valor de “z”, es superior – en términos absolutos – a 1,96, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, puesto que el valor de z obtenido es superior – en términos absolutos - al establecido como límite. Mirándolo desde otro punto de vista, cualquier valor de “z” obtenido del test y que esté ubicado en el intervalo que va entre un límite inferior de -1.96 y un limite superior de +1.96 estaría ubicado en lo que llamamos Región de Aceptación (de la hipótesis nula), y, en consecuencia, se acepta la validez de la hipótesis nula y se rechaza la hipótesis alternativa. En caso contrario, si el valor obtenido del test es inferior a -1.96 o es superior a +1.96, este valor está cayendo en lo que llamamos Región Crítica o de rechazo (de la hipótesis nula), y, en consecuencia, se acepta la hipótesis alternativa. Como se ve, en este ejemplo al menos, la región de rechazo está formada por la suma de los dos extremos de la curva Normal, es decir entre { - ∞ y -1.96} y por el área bajo la curva Normal ubicada entre {+1.96 y + ∞ }.   En otras situaciones, cuando la hipótesis alternativa es unidireccional, es decir, cuando se establece como hipótesis alternativa que   μ 1 > μ 2  O en su defecto que   μ 1 < μ 2 16

17   la Región de Rechazo está ubicada solamente en un extremo de la Distribución.   Si la Distribución utilizada en el test es nuevamente la normal, y la hipótesis alternativa fuera la primera presentada, es decir entonces el valor crítico de “z” sería 1,645 (como se puede ver en cualquier texto de Estadística que contenga la Tabla correspondiente a la Distribución Normal estandarizada, con media 0 y varianza 1) siempre y cuando el valor de α sea 0.05. Para otros valores del nivel de significancia, se debe buscar el valor correspondiente al valor crítico correspondiente a la Distribución estadística que se esté utilizando.  Igualmente, y siguiendo con el ejemplo anterior, si la hipótesis alternativa fuera, cualquier valor de “z” obtenido de la aplicación del test, igual o inferior a  -1.645 pertenecería a la Región de Rechazo y, por ende, se debería rechazar la Hipótesis nula. Nuevamente debemos recalcar que estos valores son válidos solamente cuando α = 0.05.   En este ejemplo unidireccional, como se ve, la Región Crítica no está dividida en dos, como en el caso de la hipótesis alternativa en que ambas medias son DIFERENTES. 17

18   Un Teorema esencial en Estadística es el Teorema del Límite Central, cuya lectura recomiendo a los lectores. En esencia, lo que podemos deducir de este Teorema es que si la variable original en el Universo, se distribuye normalmente, entonces la distribución de muestreo de las medias de todas las muestras posibles de extraer también es exactamente Normal en su distribución.   Lo más importante en Muestreo, y derivado de este teorema, es que cualquiera sea la forma de la distribución de la variable en el Universo, las medias de todas las muestras posibles de extraer se distribuyen asintóticamente como una Curva Normal, por lo cual muchos de los tests que se presentan en este documento, incluyen en su diseño la participación de la curva Normal (o, en su defecto, con tamaños muestrales muy pequeños, la participación de la Distribución “t” de Student)  18

19  En estos casos la Distribución queda caracterizada con sólo conocer la media y la varianza de la Distribución Normal, valores suficientes para obtener un valor estandarizado de “z” con la cual es posible utilizar la Tabla de la Curva Normal.   Sin embargo, en los programas que se presentan en este documento, diseñados utilizando el lenguaje de programación “Mathematica”, los usuarios no tendrán necesidad de dirigirse a los textos estadísticos, puesto que todos los resultados de todos los tests se presentan con los valores de “z” y de las probabilidades correspondientes, ya calculados. 19

20 20

21  PASO 6 : LA DECISION   Si el valor obtenido como resultado de un test, cae en la Región de Rechazo, nosotros rechazamos la Hipótesis Nula.   La razón detrás de esta decisión es muy simple. O aceptamos que obtuvimos este valor de muy baja probabilidad de ocurrencia bajo el supuesto que H 0 es cierta y la aceptamos, o decimos que un valor como éste, de tan baja probabilidad de ocurrencia, nos está indicando que la hipótesis nula no era cierta.   En la toma de decisiones en estos tests se ha optado por utilizar el segundo criterio, es decir, rechazamos la Hipótesis Nula. Por supuesto que en algunas raras ocasiones, nos equivocamos al rechazarla, y este valor de tan baja probabilidad de ocurrencia bajo H 0 realmente fue extraída de la Distribución teórica generada bajo el supuesto de que H 0 es verdadera. Estos pocos casos, en que deberíamos haber aceptado la H 0 pero decidimos rechazarla, corresponden a la proporción de casos determinada por α.  Por ejemplo, si α = 0.01, podemos decir que nos equivocaremos al rechazar la H 0  en un 1% de los tests que teóricamente podríamos llevar a cabo, Recordemos que los valores obtenidos del test dependerán de los datos recogidos en la muestra, y como teóricamente se puede extraer una cantidad astronómica de muestras diferentes, podemos decir, en este ejemplo de α = 0.01, que de cada 100 muestras posibles de extraer, de igual diseño y tamaño, en UNA de ellas los datos nos proporcionarán un valor, como resultado de la aplicación del test, que caerá en la Región de Rechazo establecida por nosotros automáticamente al elegir el valor de α, y rechazaremos la H 0 a pesar de que el valor pertenece a la Distribución Estadística generada cuando H 0 es cierta y por lo tanto no la debiéramos rechazar.  21

22  ESCALAS DE MEDICION   Antes de pasar a los tests que deseamos estudiar y aplicar, debemos detenernos a pensar en las escalas en que se miden los datos que estamos recolectando.   Podemos dividir, a grosso modo, 4 categorías de variables, cada una de las cuales requiere otro tipo de test para ser analizado.   Estas categorías son:   NOMINAL O CATEGORICA  ORDINAL  DE INTERVALO  DE RAZON   A continuación explicaremos muy brevemente el significado de cada una de estas escalas de medición.  22

23  1.- NOMINAL O CATEGORICA   Definiremos así a las mediciones más débiles numéricamente hablando. Estas variables se miden de tal modo que los códigos, números, nombres u otros símbolos que se usan como alternativas de respuesta a una pregunta, sólo sirven para identificar a los grupos con los que se identifican los entrevistados.  Así por ejemplo, las alternativas de respuesta a la pregunta sobre ”intenciones de voto en las próximas elecciones”, podrían ser : Candidato A, Candidato B, etc.  Entre una y otra respuesta no hay ninguna relación numérica, El candidato A no vale más que el candidato B, ni viceversa, aunque los códigos empleados fueren el 1 para el candidato A y el código 2 fuese el utilizado para designar al candidato B. Los candidatos en la lista de respuestas pueden estar anotados en cualquier orden, y el resultado continuará siendo el mismo.   PROPIEDADES FORMALES   Las únicas relaciones que se pueden efectuar con este tipo de mediciones consiste en preguntarse, por ejemplo, si las respuestas son iguales entre sí, o son diferentes, y las personas entrevistadas ( u otras unidades muestrales), se clasifican en distintos grupos acorde a sus respuestas. Todos los entrevistados con la misma respuesta, se clasifican en un mismo grupo, y los tests más utilizados en estos casos son el Test Binomial y el test de Chi-Cuadrado. 23

24  2.- ORDINAL O DE RANKEO   Definiremos así a las variables cuyas respuestas, adicionalmente a poder ser comparadas viendo si son iguales o diferentes, pueden ser comparadas viendo si una es superior – en algún sentido – a las otras, y poder así ordenarlas de mayor a menor  o de menor a mayor, rankeándolas del 1 en adelante, por ejemplo, sin que eso signifique que la diferencia entre el primero ( código 1) y el segundo ( código 2), sea igual a la diferencia entre el segundo y el tercero, y así sucesivamente.   En otras palabras se pueden ordenar, como ya dijimos, pero las diferencias entre los rankings no tienen significancia algebraica. En otras palabras, las distancias entre uno y otro son solamente de orden.   Ejemplo de este tipo de variables, son, por ejemplo, aquellas preguntas en las que se pide conocer la opinión de los entrevistados sobre el grado de importancia que le asigna a cierto atributo, o el grado de urgencia, o la prioridad que le asigna, o cuán de acuerdo o desacuerdo está con tal o cual atributo o característica.  En los estudios sociales hay muchas variables medidas en esta escala, y los Tests que hemos desarrollado ocuparán la mayor parte de nuestro interés.  24

25  3.- DE INTERVALO O ESCALA INTERVALAR   En este caso, las respuestas a las preguntas, o sea las alternativas de respuesta de la variable, son numéricas, pero la escala no tiene un cero real o natural, sino arbitrario.   Ejemplo de esto serían las escalas de temperaturas. El cero en la escala de Celsius por ejemplo, equivale a los 32 grados en la escala de Fahrenheit. Tal como este ejemplo se podrían nombrar varios otros  25

26  4.- DE RAZON   Esta escala es similar a la intervalar, pero los valores cero de la escala son reales y no pueden ser arbitrarios.  Ejemplos de esta escala de mediciones son:   Volúmenes  Distancias  Altura  Peso   Todas estas escalas y muchas otras, tienen un cero natural, no importando cual sea la unidad de medición en cada caso.  Así, por ejemplo, midiendo distancias, no importa si éstas son en kilómetros, o millas, pues “cero distancia” en ambos casos, significa lo mismo.  Este tipo de escala se mide más adecuadamente, con tests paramétricos.  En este documento, presentaremos 38 tests no-paramétricos, de los cuales:   11 Tests son utilizables válidamente para variables medidas en escala nominal,   16 Tests son utilizables válidamente para variables medidas en escala ordinal,   3 Tests son utilizables para variables medidas en escala exclusivamente intervalar,   8 Tests son utilizables tanto para variables ordinales como intervalares  Adicionalmente, podemos señalar que los tests para variables nominales son aplicables también para variables medidas en escalas superiores, como la ordinal, pero en esos casos se pierde la información adicional que encierra la escala ordinal respecto a la nominal 26

27  TESTS PARAMETRICOS Y NO PARAMETRICOS   INTRODUCCION   Un test estadístico especifica ciertas condiciones que deben poseer las distribuciones de las respuestas en la población de la cual fue extraída la muestra.  Puesto que no es común que la existencia de estas condiciones se verifiquen, ellas se presumen, incorrectamente, como cumplidas.   La credibilidad en los resultados provenientes de estos tests paramétricos dependerá en gran medida del cumplimiento de estos supuestos. Por ejemplo, los resultados de tests basados en la Curva Normal dependen de que los puntajes que han sido utilizados en el análisis estén a lo menos en una escala intervalar.   Un test estadístico no-paramétrico se basa en un modelo que especifica sólo condiciones muy generales respecto a la forma específica que asume la distribución poblacional de la cual se extrajo la muestra.   En los tests no-paramétricos los supuestos se refieren, en algunos casos, a que las observaciones sean independientes, o a que las variables en estudio posean una distribución subyacente de tipo continuo, pero estos supuestos son más débiles y más escasos que aquellos supuestos asociados a los tests paramétricos.  27

28  Más aún, los tests no-paramétricos a menudo pueden analizar hipótesis sobre poblaciones que los tests paramétricos no lo pueden hacer.  Finalmente, y a diferencia de los tests paramétricos, existen tests no-paramétricos que pueden ser aplicados apropiadamente a datos medidos en una escala ordinal y otros a datos medidos en escalas nominales o categóricas.   Puesto que en las ciencias sociales y del comportamiento, rara vez se da que las distribuciones de las variables cumplan con las exigencias de los tests paramétricos, y puesto que aumentando el tamaño muestral en aquellos casos en que el poder de un test no-paramétrico es menor al de un test paramétrico, pudiendo igualar su poder, el uso de tests no-paramétrico es el más adecuado en el caso de estudios de Opinión Pública y otros relacionados. 28

29  VENTAJAS DE LOS TESTS NO-PARAMETRICOS   1.- Si el tamaño muestral es muy pequeño, no hay alternativa al uso de tests no-paramétricos, a menos que la forma y naturaleza de la distribución de datos en la población sea conocida exactamente.   2.- Los tests no-paramétricos usualmente exigen menos supuestos acerca de los datos y además pueden ser más relevantes en una situación particular. Adicionalmente, la hipótesis testeada por el test no- paramétrico específico utilizado, puede ser más apropiada para los efectos de la investigación.   3.- Están a nuestra disposición tests no-paramétricos cuya función es analizar datos que vienen en forma de rankings (ordinales) y cuyos diversos valores no tienen la fuerza de las variables intervalares ( vale decir, los valores numéricos de la diferencia entre dos lugares cualquiera en el ranking, no tienen sentido aritmético, y por lo tanto, no pueden ser analizados por tests paramétricos.  29

30  4.- Existen métodos no-paramétricos para tratar datos que están clasificados simplemente en una escala nominal. No existen métodos paramétricos para analizar dichos datos.   5.- Existen métodos no-paramétricos que nos permiten trabajar con muestras compuestas de elementos extraídos de diferentes poblaciones. Los métodos paramétricos que nos permitirían tratar con estas situaciones requerirían de nuestra parte supuestos totalmente no realísticos y computaciones muy complejas   6.- Los tests no-paramétrico son usualmente mucho más fáciles de aprender, de aplicar y de entender que los tests paramétricos. Su interpretación también es más directa y generalmente entrega más información para el análisis final, que los tests paramétricos  30

31  TABLA RESUMEN   A continuación presentaremos una tabla con la distribución de los 38 tests, según dos variables de clasificación, a saber:   1.- Escala en la que está(n) medida(s) las variables:   Nominal, Ordinal o Intervalar,   2.- Número de muestras intervinientes:   Una muestra, dos muestras, “k” muestras   En el caso de 2 muestras o de “k” muestras, distinguiremos también entre “muestras independientes” y “paneles” 31

32 32  Adicionalmente, distinguiremos el caso de tests para calcular coeficientes de correlación y diversas medidas de asociación con sus correspondientes tests de verificación de la significancia de estas medidas de asociación (12 de los 38 tests corresponden a esta categoría)   A continuación se presenta una tabla con la ubicación de los distintos tests, según número de muestras participantes en el test y tipo de escala de medición de las variables. Cada celda representa una situación estadística especial para la cual hay uno o más tipos de test. Como se observa las celdas se distinguen por un número que indica una familia de tests para dicha celda.  Para cada una de los 14 tipos de celda, se presentarán los tests que pertenecen a dicha celda, las circunstancias en las que se pueden utilizar, y un ejemplo numérico esclarecedor. 

33 33

34 34

35 35

36 36

37 37

38 38


Descargar ppt "1  INTRODUCCION A LOS  TESTS DE HIPÓTESIS.   INTRODUCCION:   Los profesionales de nuestro medio saben que las “ estadísticas” no son como el común."

Presentaciones similares


Anuncios Google