Bioestadística Escala Cuantitativa.
Trabajadores en una fábrica. RegistroSexoEdad (años)Talla (m)Peso (kg) 1Fem Masc Masc Fem Fem Masc Masc
Trabajadores en una fábrica. VariableNPromedioDesviación Estándar Edad (años) Masculino Femenino Talla (m) Masculino Femenino Peso (kg) Masculino Femenino
Escala cuantitativa. Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna faceta de los datos, utilizamos una medida descriptiva, que puede ser: De posición (media o promedio, posición percentilar o percentil) De dispersión (rango, recorrido intercuartilar, varianza, desviación estándar)
Media o promedio. n Fórmula: donde x i indica que hay que sumar todas las equis (x) disponibles desde x 1 hasta x N.
Ejemplo de una media (con edad).
Propiedades de la media. Unicidad. Simplicidad. Los valores extremos influyen en la media y pueden distorsionarla. Al mezclar dos grupos, la media del nuevo grupo es igual al promedio ponderado, o: (N 1 1 +N 2 2 )/(N 1 +N 2 ) Se utiliza para resumir datos cuantitativos con una distribución (aproximadamente) simétrica.
Propiedades de la media. Unicidad. Simplicidad. Los valores extremos influyen en la media y pueden distorsionarla. Al mezclar dos grupos, la media del nuevo grupo es igual al promedio ponderado, o: (N 1 1 +N 2 2 )/(N 1 +N 2 ) Se utiliza para resumir datos cuantitativos con una distribución (aproximadamente) simétrica.
Propiedades de la media. Unicidad. Simplicidad. Los valores extremos influyen en la media y pueden distorsionarla. Al mezclar dos grupos, la media del nuevo grupo es igual al promedio ponderado, o: (N 1 1 +N 2 2 )/(N 1 +N 2 ) Se utiliza para resumir datos cuantitativos con una distribución (aproximadamente) simétrica.
Ejemplo de una media (con edad).
Propiedades de la media. Unicidad. Simplicidad. Los valores extremos influyen en la media y pueden distorsionarla. Al mezclar dos grupos, la media del nuevo grupo es igual al promedio ponderado, o: (N 1 1 +N 2 2 )/(N 1 +N 2 ) Se utiliza para resumir datos cuantitativos con una distribución (aproximadamente) simétrica.
Ejemplo de una media (con edad).
Propiedades de la media. Unicidad. Simplicidad. Los valores extremos influyen en la media y pueden distorsionarla. Al mezclar dos grupos, la media del nuevo grupo es igual al promedio ponderado, o: (N 1 1 +N 2 2 )/(N 1 +N 2 ) Se utiliza para resumir datos cuantitativos con una distribución (aproximadamente) simétrica.
Percentiles. El más conocido es la mediana. Los valores de la variable se ordenan de menor a mayor y se numeran progresivamente. La posición se determina mediante (N + 1)0.5. Si la ecuación anterior brinda un número entero, el valor de la mediana corresponde al que se encuentre en esa posición. En caso contrario, la fracción que sigue al entero ha de multiplicarse por la diferencia que exista entre los dos valores ordenados de la variable y el resultado sumarse al valor de menor magnitud.
Percentiles. El más conocido es la mediana. Los valores de la variable se ordenan de menor a mayor y se numeran progresivamente. La posición se determina mediante (N + 1)0.5. Si la ecuación anterior brinda un número entero, el valor de la mediana corresponde al que se encuentre en esa posición. En caso contrario, la fracción que sigue al entero ha de multiplicarse por la diferencia que exista entre los dos valores ordenados de la variable y el resultado sumarse al valor de menor magnitud.
Percentiles. El más conocido es la mediana. Los valores de la variable se ordenan de menor a mayor y se numeran progresivamente. La posición se determina mediante (N + 1)0.5. Si la ecuación anterior brinda un número entero, el valor de la mediana corresponde al que se encuentre en esa posición. En caso contrario, la fracción que sigue al entero ha de multiplicarse por la diferencia que exista entre los dos valores ordenados de la variable y el resultado sumarse al valor de menor magnitud.
Percentiles. El más conocido es la mediana. Los valores de la variable se ordenan de menor a mayor y se numeran progresivamente. La posición se determina mediante (N + 1)0.5. Si la ecuación anterior brinda un número entero, el valor de la mediana corresponde al que se encuentre en esa posición. En caso contrario, la fracción que sigue al entero ha de multiplicarse por la diferencia que exista entre los dos valores ordenados de la variable y el resultado sumarse al valor de menor magnitud.
Posición de la mediana (7+1)0.5 = 4.0 Valor de la mediana = 70.9 iPeso
Posición de la mediana (6+1)0.5 = 3.5 Valor de la mediana 65.8+( )0.5 = 68.2 iPeso
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
iPeso iPeso Mediana Media
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
iPeso % 50 %
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Propiedades de la mediana. Ventajas Unicidad. Simplicidad. No es afectada por los valores extremos. Interpretación probabilística: 50% de los valores se encuentran por arriba (y por debajo). Adecuada para datos sin distribución simétrica. Desventajas No toma en cuenta la magnitud precisa de la mayoría de las observaciones. Si dos grupos se mezclan, no puede calcularse a partir de la mediana de cada grupo. No es muy utilizada en las técnicas estadísticas elaboradas.
Otros valores percentilares. Cada percentil indica el porcentaje de observaciones que en una serie ordenada de menor a mayor está antes que el valor señalado. Para calcular su posición multiplicamos (N+1) por el percentil (expresado como proporción) que buscamos (0.05, 0.25, 0.75, 0.95, etc.). Al percentil 25 suele dársele el nombre de “primer cuartil” y al percentil 75 se le da el nombre de “tercer cuartil”.
Otros valores percentilares. Cada percentil indica el porcentaje de observaciones que en una serie ordenada de menor a mayor está antes que el valor señalado. Para calcular su posición multiplicamos (N+1) por el percentil (expresado como proporción) que buscamos (0.05, 0.25, 0.75, 0.95, etc.). Al percentil 25 suele dársele el nombre de “primer cuartil” y al percentil 75 se le da el nombre de “tercer cuartil”.
Otros valores percentilares. Cada percentil indica el porcentaje de observaciones que en una serie ordenada de menor a mayor está antes que el valor señalado. Para calcular su posición multiplicamos (N+1) por el percentil (expresado como proporción) que buscamos (0.05, 0.25, 0.75, 0.95, etc.). Al percentil 25 suele dársele el nombre de “primer cuartil” y al percentil 75 se le da el nombre de “tercer cuartil”.
Posición del 1 er cuartil (6+1)0.25 = 1.75 Valor del 1 er cuartil 60.4+( )0.75 = 64.2 Posición del 3 er cuartil (6+1)0.75 = 5.25 Valor del 3 er cuartil 78.2+( )0.25 = 78.7 iPeso
La moda. Es el valor que aparece con mayor frecuencia en un grupo de datos. Un grupo de datos puede tener más de una moda. Esta medida se puede utilizar tanto para variables cualitativas como para cuantitativas. Es poco utilizada por lo escaso de la información que brinda y lo limitado de su interpretación.
Rango. Es la diferencia entre el valor máximo y el mínimo de un conjunto de datos: donde R es el rango, x L es el valor mayor por y x S es el menor.
Dificultades en el uso del rango. El valor está determinado por dos de las observaciones originales. Cálculos basados en valores extremos no son confiables debido a que entre dos investigaciones similares pueden ocurrir valores extremos diferentes. La interpretación del rango depende del número de observaciones. Si son pocas es mejor utilizar el recorrido intercuartilar, que es aquella comprendida entre el primero y el tercer cuartil.
Dificultades en el uso del rango. El valor está determinado por dos de las observaciones originales. Cálculos basados en valores extremos no son confiables debido a que entre dos investigaciones similares pueden ocurrir valores extremos diferentes. La interpretación del rango depende del número de observaciones. Si son pocas es mejor utilizar el recorrido intercuartilar, que es aquella comprendida entre el primero y el tercer cuartil.
Dificultades en el uso del rango. El valor está determinado por dos de las observaciones originales. Cálculos basados en valores extremos no son confiables debido a que entre dos investigaciones similares pueden ocurrir valores extremos diferentes. La interpretación del rango depende del número de observaciones. Si son pocas es mejor utilizar el recorrido intercuartilar, que es aquella comprendida entre el primero y el tercer cuartil.
Rango: = er. Cuartil: er. Cuartil: 80.0 Recorrido intercuartilar: = 14.5 iPeso
Varianza y desviación estándar. Fórmula de la varianza: La varianza se expresa en unidades cuadradas que son difíciles de interpretar. La desviación estándar es igual a la raíz cuadrada de la varianza.
Talla (x)x i -µ(x i -µ) = = = = = = = µ = =
Diferencia de medias Se define como la diferencia que resulta de la media en un grupo (expresada como µ 1 ) menos la media correspondiente en el otro grupo (µ 0 ). Su fórmula es
Diferencia de medias: ejemplo VariableNPromedioDesviación Estándar Edad (años) Masculino Femenino
Arreglo ordenado. Lista de valores agrupados de una colección. Para agrupar un conjunto de observaciones se selecciona un conjunto de intervalos contiguos, que no se traslapen, tales que cada valor en el conjunto de observaciones pueda colocarse en uno, y sólo uno, de los intervalos (intervalos de clase).
Arreglo ordenado. Lista de valores agrupados de una colección. Para agrupar un conjunto de observaciones se selecciona un conjunto de intervalos contiguos, que no se traslapen, tales que cada valor en el conjunto de observaciones pueda colocarse en uno, y sólo uno, de los intervalos (intervalos de clase).
Intervalos de clase Límite inferiorLímite superiorFrecuenciaPorcentaje Distribución de tallas de un grupo de 100 niños.
Número de intervalos de clase. Utilizar los intervalos de clase ya se hayan determinado con anterioridad. k = (log n ), donde k representa el número de intervalos de clase y n es el número de valores en el conjunto de datos bajo consideración. El número de intervalos que se obtenga no es una guía y ha de aumentarse o disminuirse según convenga en beneficio de una presentación clara.
Número de intervalos de clase. Utilizar los intervalos de clase ya se hayan determinado con anterioridad. k = (log n ), donde k representa el número de intervalos de clase y n es el número de valores en el conjunto de datos bajo consideración. El número de intervalos que se obtenga no es una guía y ha de aumentarse o disminuirse según convenga en beneficio de una presentación clara.
Número de intervalos de clase. Utilizar los intervalos de clase ya se hayan determinado con anterioridad. k = (log n ), donde k representa el número de intervalos de clase y n es el número de valores en el conjunto de datos bajo consideración. El número de intervalos que se obtenga no es una guía y ha de aumentarse o disminuirse según convenga en beneficio de una presentación clara.