La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

TEMA 3: INTRODUCCIÓN A LA QUIMIOMETRÍA Asignatura: Análisis Químico

Presentaciones similares


Presentación del tema: "TEMA 3: INTRODUCCIÓN A LA QUIMIOMETRÍA Asignatura: Análisis Químico"— Transcripción de la presentación:

1 TEMA 3: INTRODUCCIÓN A LA QUIMIOMETRÍA Asignatura: Análisis Químico
Cualquier medida llevada a cabo en el laboratorio analítico lleva asociado algún error. Los errores en los resultados de análisis bioanalíticos pueden tener efectos sociales y personales de importancia. El verdadero valor de algo es imposible medirlo, siendo la mejor opción la aplicación cuidadosa de una técnica establecida. Los científicos usan cálculos estadísticos para afinar sus juicios relativos a la calidad de las medidas experimentales. En este tema se tratan las aplicaciones más comunes de las pruebas estadísticas al tratamiento de datos analíticos. Asignatura: Análisis Químico Grado: Bioquímica Curso académico: 2011/12 N. Campillo Seva

2 La incertidumbre en las medidas científicas 1.1. Precisión y exactitud
1.2. Tipos de error. Propagación de errores 1.3. Cifras significativas 2. ESTADÍSTICA 2.1. Distribución de Gauss 2.2. Intervalos de confianza 2.3. Comparación de medias utilizando la t de Student 2.4. Comparación de desviaciones estándar con el test F 2.5. Test Q de datos sospechosos N. Campillo Seva

3 1. La incertidumbre en las medidas científicas
El trabajo científico Nos exactos Nos inexactos Números enteros o fracciones Constantes matemáticas (π, e…) Relaciones: 1 kg = 1000 g; 1 µg = 1000 ng; 1 m = 10 dm; 1 día = 1440 min; 1 cc = 1 mL 1 L = 1000 mL … Masa de 1 L de leche Superficie de una mesa Volumen de café contenido en un recipiente Concentración de NaCl en el agua del Mar Menor En el trabajo científico se manejan tanto con números exactos como inexactos. Como ejemplo de números exactos, tenemos los números enteros o fracciones (1, 2, 3…; ½, ¾…), las constantes matemáticas (π, e...) y las relaciones (1 kg=1000g; J=1 cal…). Los números inexactos son aquellos obtenidos a través de mediciones experimentales, siempre conllevan una incertidumbre asociada. Los nos obtenidos por mediciones experimentales son siempre inexactos, tienen una incertidumbre asociada N. Campillo Seva

4 LA INCERTIDUMBRE ES TAN IMPORTANTE COMO LA MEDIDA MISMA
EL PROCESO ANALÍTICO DEFINICIÓN DE RÉPLICAS DE MUESTRAS El proceso de medida debe llevarse a cabo en varias alícuotas idénticas de la muestra Finalidad Establecer la variabilidad del análisis Evitar un error grave LA INCERTIDUMBRE ES TAN IMPORTANTE COMO LA MEDIDA MISMA 1 mL mg/dL 1 mL mg/dL 1 mL mg/dL 1mL mg/dL F2 F1 Como ya se indicó en el Tema 1, la definición de varias réplicas de la muestra resulta indispensable para estimar la fiabilidad de los resultados, ya que un único análisis no informa acerca de la variabilidad asociada. X ± SD N. Campillo Seva

5 Cada medida tiende a ser distinta de las demás:
La mejor estimación es el valor central del conjunto RESULTADOS DE 6 DETERMINACIONES DE Fe REPETIDAS EN UNA MUESTRA QUE CONTENÍA 20 ppm Valor verdadero 19, , , ,4 x=19,78 ppm xt=20,0 ppm Fe(III) Los resultados de varias réplicas de una misma muestra tienden a ser distintos entre sí, de forma general se considera al valor central del conjunto como la mejor estimación. Supongamos que se determina la concentración de hierro en una muestra en seis alícuotas de la muestra (los seis resultados aparecen representados como puntos rojos), cuyo valor verdadero de contenido de hierro es 20,00 ppm. El valor central corresponde a 19,78 ppm y debe ser más fiable que cualquiera de los resultados individuales. La medida de la tendencia central más utilizada es la media, también conocida como media aritmética, valor medio o promedio. La media se obtiene al dividir la suma de los valores de las distintas medidas entre el número de medidas (N) del conjunto. La mediana es el resultado medio cuando los datos se escriben en orden creciente o decreciente. Para un número de resultados impar, la mediana se obtiene de forma directa, si el nº de resultados es par, se usa la media del par central. En casos ideales, la media y la mediana coinciden, pero difieren cuando el número de medidas del conjunto es pequeño. Media, media aritmética o promedio: medida de la tendencia central más usada Mediana N. Campillo Seva

6 Informan de la desviación de la media
1.1. PRECISIÓN Y EXACTITUD Términos empleados para expresar las incertidumbres asociadas a las medidas PRECISIÓN 19,3 – 19,1 – 18,9 – 19,2 – 19,3….. 19,2 – 15,4 – 25,8 – 20,7 – 11,9… (reproducibilidad) Se describe a través de tres términos: Desviación estándar (s, SD ó e) Varianza: (s2 ó e2) Coeficiente de variación ó desviación estándar relativa (%s, %e, CV, DER ó RSD) Informan de la desviación de la media La precisión es una medida de la reproducibilidad de un resultado. Si se mide una cantidad varias veces exactamente de la misma manera y los valores obtenidos se aproximan mucho entre sí, se dice que la medida es precisa. Si los valores varían mucho entre sí, se dice que la medida no es precisa. Son tres los términos de uso generalizado para describir la precisión de un conjunto de resultados: desviación estándar, varianza y coeficiente de variación. Las tres funciones informan de cuánto difiere de la media una medida xi, lo que se llama desviación de la media, di. La exactitud describe la proximidad del valor medido respecto al valor “verdadero” o “aceptado”. EXACTITUD (cercanía al valor verdadero) Valor verdadero: 35,4 35,5 95,2 N. Campillo Seva

7 ↓ PRECISIÓN ↓ EXACTITUD ↑ PRECISIÓN ↓ EXACTITUD ↑ PRECISIÓN
La diferencia entre precisión y exactitud puede verse claramente a través de esta diapositiva. Una medida puede ser reproducible pero errónea. Por ejemplo, si se comete un error al preparar una disolución patrón de Fe, ésta no tendrá la concentración deseada. Al llevar a cabo la cuantificación de Fe en una muestra repetidas veces, los resultados pueden ser muy precisos pero inexactos, porque la concentración real de la disolución patrón no es la que deseábamos preparar. En definitiva: buena precisión, mala exactitud. Pero también puede ocurrir que las medidas sean poco reproducibles, pero en torno al valor correcto, porque la disolución patrón fuese preparada sin errores pero el método analítico empleado no sea muy reproducible. En definitiva: mala precisión, buena exactitud. Situación ideal: procedimientos exactos y precisos. N. Campillo Seva

8 EXACTITUD Más difícil de determinar que la precisión Valor verdadero
El obtenido por una persona experimentada a través de un procedimiento bien establecido, mejor aún si se ha obtenido a través de varios procedimientos y en distintos laboratorios: Valor aceptado Valor verdadero Error absoluto (E) = xobtenido - xverdadero 19, , , ,4 ppm Fe(III) xt=20,0 x=19,78 ppm E = 19,8 – 20 = -0,2 ppm La exactitud es con frecuencia más difícil de determinar que la precisión, pues para la precisión basta con analizar varias réplicas de la muestra. Pero para determinar la exactitud se requiere del valor verdadero. Para obtener el valor verdadero de un parámetro, éste habrá tenido que ser medido experimentalmente y toda medida experimental lleva asociada un error. Podríamos definir el valor verdadero como el obtenido por una persona experimentada empleando un procedimiento bien establecido o, mejor aún sería preferible que ese valor hubiese sido obtenido a través de diferentes procedimientos analíticos y en distintos laboratorios analíticos. En cualquier caso, el error asociado podría minimizarse pero nunca anularse, por ello parece más apropiado hablar de valor aceptado más que verdadero. La exactitud se expresa en términos del error absoluto o relativo. El error absoluto del resultado (19,8) obtenido inmediatamente a la izquierda del valor verdadero (20) es – 0,2ppm. El error absoluto del resultado 20,1 ppm es +0,1 ppm. Obsérvese que se mantiene el signo al expresar el error, pues nos informa si se produce por exceso o defecto. El error relativo es frecuentemente más útil que el error absoluto. Er = 19,8 – 20 20 x 100 = -1% N. Campillo Seva

9 1.2. TIPOS DE ERROR EXPERIMENTAL
SISTEMÁTICO O DETERMINADO ALEATORIO O INDETERMINADO Cualquier medida lleva asociada una incertidumbre, que se llama error experimental. Los resultados pueden expresarse con un mayor o menor grado de confianza, pero nunca con total certeza. Los análisis químicos se ven afectados al menos por dos tipos de errores: SISTEMÁTICOS y ALEATORIOS. Existe otro tipo de error denominado BRUTO. BRUTO N. Campillo Seva

10 TIPOS DE ERROR EXPERIMENTAL
SISTEMÁTICO O DETERMINADO Fallo del equipo o del diseño del experimento Aunque es difícil, puede descubrirse y corregirse Calibrar todo el instrumental empleado Analizar muestras de composición conocida (materiales de referencia) Analizar muestras “blanco” Usar otros métodos analíticos Comparación entre varios laboratorios mediante el mismo o distintos métodos analíticos ¿Cómo? Volumen teórico: 4,99 – 5,01 mL Volumen real: 5,12 mL El error sistemático o determinado hace que la media de un conjunto de datos difiera del valor aceptado y se origina principalmente por un fallo del diseño del experimento o por un fallo del equipo. Este tipo de error es difícil de descubrir aunque no imposible. Supongamos que para la liberación de reactivo valorante en una volumetría directa utilizamos una bureta de 10 mL, que no hemos calibrado previamente y el volumen liberado hasta alcanzar el punto final de la valoración es de 8,62 ± 0,02 mL. Si supuestamente se están obteniendo resultados por exceso, es probable que el volumen real liberado de valorante sea superior a los valores de lectura de bureta. La calibración del material volumétrico sería una buena forma de corregir este error sistemático. Existen diferentes modos de detectar un error sistemático, citamos algunos de ellos: - Analizar muestras de composición conocida, tales como un material de referencia certificado. - Analizar muestras blanco. Si se observa un resultado distinto de cero, el método acarrea un error por exceso. - Usar métodos analíticos diferentes para llevar a cabo el análisis. Si los resultados no concuerdan, hay un error en uno o más de los métodos. - Comparación entre varios laboratorios. Designamos distintas personas para analizar la misma muestra mediante el mismo o distintos métodos analíticos. Este error es reproducible F1 10 N. Campillo Seva

11 TIPOS DE ERROR EXPERIMENTAL
ALEATORIO O INDETERMINADO Originados por variables incontrolables en cada medida Nivel del menisco Siempre está presente y no puede ser corregido - Si varias personas leen esta escala, es muy probable que den valores distintos e incluso, una misma persona al leerla en distintos momentos. El error aleatorio o indeterminado se origina por efecto de variables incontroladas. Tiene igual probabilidad de ser positivo que negativo. Siempre está presente y no puede ser corregido. Como ejemplo de error aleatorio podemos citar el producido al tomar la lectura de volumen en una bureta. Si una determinada lectura es llevada a cabo por personas diferentes, con toda probabilidad cada persona daría un valor distinto para la segunda cifra decimal, pues la interpolación entre rayas es algo subjetiva. Incluso una misma persona al leer la misma magnitud varias veces puede dar lecturas distintas. Aunque estos errores no pueden eliminarse, sí se pueden minimizar mejorando el trabajo experimental. - Ruido eléctrico del instrumento Estos errores no pueden eliminarse pero sí minimizarse mejorando las condiciones de trabajo experimental F1 N. Campillo Seva

12 TIPOS DE ERROR EXPERIMENTAL
ERROR BRUTO Ocurre de forma ocasional Suele ser grande Provoca que el resultado sea muy alto o muy bajo El error bruto generalmente ocurre de forma ocasional y suele ser grande. Puede ser común que un humano cometa este tipo de errores, por ejemplo perder parte del precipitado antes de su pesada en una gravimetría. Estos errores dan ligar a valores atípicos, son valores que difieren mucho de los demás en un conjunto de datos de medidas replicadas. La determinación de un valor atípico puede llevarse a cabo a través de pruebas estadísticas. Da como resultado valores atípicos

13 PROPAGACIÓN DE ERRORES
Valor medio (±desviación estándar) (±s) PROPAGACIÓN DE ERRORES Sumas y restas Ejemplo con tres términos 1,25 (±0,01) + 1,35 (±0,05) – 0,21 (±0,02) = 2,39 (±s4) = 2,39 (±0,05) s s s3 Productos y cocientes En la mayoría de los trabajos experimentales es necesario hacer operaciones aritméticas con varios datos, teniendo cada uno de ellos un error aleatorio asociado. La incertidumbre más probable del resultado no es simplemente la suma de los errores individuales, pues es probable que algunos de ellos sean positivos y otros negativos. Por esta razón, es probable que algunos de los errores se anulen entre sí. En la diapositiva se muestran las ecuaciones matemáticas usadas para el cálculo de propagación de errores en sumas y restas, así como en productos y cocientes. N. Campillo Seva

14 1.3. CIFRAS SIGNIFICATIVAS
Nº mínimo de cifras necesario para expresar un determinado valor en notación científica sin perder exactitud. Todos los dígitos conocidos con certeza y el primero incierto: El 0 puede ser o no significativo según su posición: ● 30,22 mL ● 0,03022 L ● 83500: 8,35 x 104, tres cifras significativas 8,350 x 104, cuatro cifras significativas 8,3500 x 104, cinco cifras significativas Si un nº acaba en ceros, pero no tiene coma decimal: se puede suponer que los ceros no son sign. Notación exponencial Con certeza: 9,6 < Nivel < 9,7 El número de cifras significativas es el mínimo número de dígitos necesarios para escribir un valor dado en notación científica sin perder exactitud. Otra forma de definir lo que son las cifras significativas de una determinada medida es el número de dígitos conocidos con certeza más el primero incierto. Por ejemplo: al tomar la lectura de volumen en la bureta de la diapositiva, se puede afirmar que el nivel del líquido es mayor de 9,6 y menor que 9,7 mL con certeza. Podemos estimar que el líquido entre las dos graduaciones corresponde a 0,08 mL, por tanto según el acuerdo de cifras significativas podemos asegurar que el volumen medido es de 9,68 mL, que tiene 3 cifras significativas, dos ciertas y una incierta. La cifra cero puede ser significativa o no dependiendo de su ubicación en el número: Un cero rodeado por otros dígitos siempre es significativo: 30,22 mL Los ceros que sitúan sólo la coma decimal no son significativos: 0,03022 L, sigue teniendo 4 cifras significativas. Los ceros al final del número pueden ser significativos o no: Si se expresa el volumen de un vaso como 2,0 L, la presencia del cero indica que el volumen se conoce hasta unas décimas de litro, por lo que ese 0 es significativo. Si este mismo volumen lo expresamos como 2000 mL, si no se conoce el volumen en centésimas de litro, seguimos teniendo dos cifras significativas. 3 cifras significativas: 9,68 F1 N. Campillo Seva

15 CIFRAS SIGNIFICATIVAS en los cálculos numéricos
El resultado de la suma o la resta debe expresarse con el mismo nº de cifras decimales que la magnitud con menos cifras decimales Sumas y restas: 3,4 + 0, ,31 = 10,730 10,7 Dígito incierto Productos y cocientes: El resultado de la multiplicación o la división debe expresarse con el mismo nº de cifras significativas del factor con menos cifras significativas ¿Cuántos dígitos deben mantenerse en un resultado tras hacer operaciones aritméticas? En la suma y resta si los términos tienen el mismo número de dígitos, el resultado tendrá el mismo número de decimales que los números individuales. Si los números que se suman o restan no tiene el mismo número de cifras significativas, el resultado debe expresarse con el mismo número de cifras decimales que la magnitud con menos cifras decimales. Ahora bien debe operarse con todas las cifras decimales y redondear al final. Cuando se opera con números expresados en notación científica, todos los términos deben de tener el mismo exponente. En la multiplicación y división, el resultado debe expresarse con el mismo número de cifras significativas del factor con menos cifras significativas. Las potencias de diez no influyen en el número de cifras que se pueden mantener en el resultado final. 2,453 x 10-8 : 1,05 x 104 2,34 x10-12 2,4522 x 10-18 x 0, x 1013 1, x 10-5 2,45 : 0,75 3,3 2,45 x 10-8 x 0,75 1,8 x 10-8 N. Campillo Seva

16 2. ESTADÍSTICA Proporciona herramientas para:
Aceptar conclusiones que presentan probabilidad alta de ser correctas Rechazar conclusiones que presentan baja probabilidad de ser correctas La Estadística nos proporciona herramientas para aceptar conclusiones que tienen alta probabilidad de ser correctas y rechazar las conclusiones cuya probabilidad de ser incorrectas es alta. Cuando las herramientas estadísticas son aplicadas al área de la Química, hablamos de Quimiometría.

17 En el laboratorio habitualmente 2-5 veces
2.1. Distribución de Gauss - Repetición del experimento un nº elevado de veces - Errores sólo aletorios Centro de la distribución Nº de medidas Distribución de Gauss En el laboratorio habitualmente 2-5 veces - Existe igual probabilidad de que la medida sea > ó < que la media - La probabilidad de observar un valor disminuye al aumentar su distancia a la media Cuando un experimento se repite un número elevado de veces y los errores son solamente aleatorios, los resultados tienden a agruparse simétricamente en torno al valor medio, asemejándose el perfil de la agrupación obtenida a una curva ideal llamada Distribución de Gauss. Aunque en realidad en un laboratorio no llevamos a cabo el análisis de una misma muestra 200 ni 100 veces, lo más habitual es repetirlo de 2 a 5 veces, también podemos estimar los parámetros estadísticos que caracterizan a una serie de un número grande de medidas. Decimos que la variación de los datos experimentales está distribuida normalmente cuando al repetir medidas aparece una distribución en forma de campana. Existe la misma probabilidad de que una medida sea mayor o menor que la media. Además, la probabilidad de observar un valor disminuye a medida que aumenta la distancia a la media. La media constituye el centro de la distribución y la desviación estándar (s) mide el ancho de la distribución, éste último es uno de los parámetros de los que hablamos cuando al principio del tema presentamos la precisión. Se define como una medida del grado de proximidad de los datos en torno al valor de la media. Cuanto menor es s, más estrechamente se agrupan los datos alrededor de la media y decimos que la precisión es alta. F1 Concentración, mg/dL Ancho de la distribución: A ↓s, ↑ agrupamiento de los resultados alrededor de la media: Mayor precisión N. Campillo Seva

18 Concentración glucosa, mg/dL
s: Medida del grado de proximidad de los datos al valor medio Concentración glucosa, mg/dL Nº de medidas Serie infinita de datos: Verdadera media: µ Desviación estándar: σ Serie finita de datos: : Media muestral s : Desviación estándar muestral 2 Grados de libertad F1 Distribuciones normales con igual valor medio y distinta desviación estándar Varianza = s2 Para una serie infinita de datos, la media se designa con la letra griega «µ» y la desviación estándar con la letra griega «σ». Hay que tener claro que nunca medimos µ y σ, pero la media y la desviación estándar se acercan a µ ya σ, respectivamente, a medida que aumenta el número de medidas. Como se indicó en el apartado 1.1. de este tema, la precisión se puede estimar a través de tres términos: desviación estándar, varianza y coeficiente de variación. Se denomina varianza al cuadrado de la desviación estándar. Se llama desviación estándar relativa (RSD) o coeficiente de variación a la desviación estándar expresada como porcentaje del valor medio. Coeficiente de variación o desviación estándar relativa (CV, RSD, %e ó %s) N. Campillo Seva

19 ÁREA BAJO LA CURVA DE GAUSS
En toda curva de Gauss: ● 68,3% del área está comprendido en el intervalo de ● 95,5% del área de ● 99,7% del área de F1 Dos técnicas analíticas diferentes: A y B para determinación de Fe en sangre RSD = 0,4% RSD = 1,1% 2/3 de las medidas están dentro del 0,4% de la media dentro del 1,1% de la media Cuanto mayor es la desviación estándar, más ancha es la curva de Gauss. En toda curva de Gauss, el área comprendida en el intervalo desde el valor medio menos la desviación estándar hasta el valor medio mas la desviación estándar supone el 68,3% del área total. Es decir, es de esperar que más de 2/3 de las medidas no disten de la media en más de una desviación estándar. Además el 95,5% del área está entre el resultado de sumar al valor medio el doble de la desviación estándar y el resultado de restar al valor medio el doble de la desviación estándar. El 99,7% del área se encuentra entre los valores obtenidos al resta y sumar el triple de la desviación estándar al valor medio. Supongamos que se emplean dos métodos analíticos diferentes, A y B para llevar a cabo la determinación de hierro en una muestra de sangre, y que el método A tiene una RSD de 0,4% y B de 1,1%. Se puede esperar que aproximadamente 2/3 de las medidas obtenidas mediante el método A estén dentro del 0,4% de la media, mientras que para el método B, 2/3 de las medidas estarán dentro del 1,1% de la media. N. Campillo Seva

20 PROBABILIDAD DE OBTENER UNA MEDIDA
Ecuación de la curva de Gauss: Factor de normalización µ = 0 σ = 1 F1 Si transformamos x en z: La probabilidad de medir z en un intervalo es igual al área de dicho intervalo: Para una serie finita de datos, µ se aproxima al valor medio y σ a la desviación estándar. La Figura de la diapositiva representa la ecuación de la curva de Gauss para σ=1 y µ=0. Así el valor máximo de «y» se encuentra en x=µ, y la curva es simétrica respecto a x=µ. Resulta muy útil expresar las desviaciones respecto de la media como múltiplos de la desviación estándar. Esto se lleva a cabo transformando el valor de «x» en otro valor numérico llamado «z» a través de la expresión matemática que aparece en la diapositiva. De este modo, la probabilidad de medir z en un cierto intervalo es igual al área de ese intervalo. Por ejemplo, la probabilidad de observar z entre -2 y -1 es 0,136 y corresponde a la zona coloreada en azul en la Figura, F1. Dado que la suma de las probabilidades de todas las medidas es la unidad, él área debajo de la curva desde -∞ a +∞ es igual a la unidad. Área (z=2) = 0,4773 Área (z=1) = 0,3413 Área entre -2 y -1 = 0,136 Área desde z= -∞ y +∞ N. Campillo Seva

21 |z|a Ordenada y área de la curva normal de error (de Gauss) y Áreab
0,0 0,398 9 0,000 0 1,4 0,149 7 0,419 2 2,8 0,007 9 0,497 4 0,1 0,397 0 0,039 8 1,5 0,129 5 0,433 2 2,9 0,006 0 0,498 1 0,2 0,391 0 0,079 3 1,6 0,110 9 0,445 2 3,0 0,044 0 0, 0,3 0,381 4 0,117 9 1,7 0,094 1 0,455 4 3,1 0,033 0 0, 0,4 0,368 3 0,155 4 1,8 0,079 0 0,464 1 3,2 0,002 4 0, 0,5 0,352 1 0,191 5 1,9 0,065 6 0,471 3 3,3 0,001 7 0, 0,6 0,333 2 0,225 8 2,0 0,054 0 0,477 3 3,4 0,001 2 0, 0,7 0,312 3 0,258 0 2,1 0,482 1 3,5 0,000 9 0, 0,8 0,289 7 0,288 1 2,2 0,035 5 0,486 1 3,6 0,000 6 0, 0,9 0,266 1 0,315 9 2,3 0,028 3 0,489 3 3,7 0,000 4 0, 1,0 0,242 0 0,341 3 2,4 0,022 4 0,491 8 3,8 0,000 3 0, 1,1 0,217 9 0,364 3 2,5 0,017 5 0,493 8 3,9 0,000 2 0, 1,2 0,194 2 0,384 9 2,6 0,013 6 0,495 3 4,0 0,000 1 1,3 0,171 4 0,403 2 2,7 0,010 4 0,496 5 a z = (x - µ) / σ b Área se refiere al área entre z=0 y z= el valor de la tabla. Por tanto, el área desde z=0 a z=1,4 vale 0,4192. El área de z=-0,7 a z=0 es la misma que desde z=0 a z=0,7. El área desde z=-0,5 a z=+0,3 vale (0, ,1179 = 0,3094. El área total entre –z = -∞ y z = +∞ vale 1. |z|a La Tabla muestra los valores de las áreas debajo de cada porción de la curva de Gauss. N. Campillo Seva

22 Supongamos: x = 845,2 mg/dL y s= 94,2 mg/dL
Concentración, mg/dL Nº de medidas 0,7258 0,9452 Probabilidad de obtener un resultado menor de 900: 1º. Cálculo de z: 2º. Área entre el valor medio y z=0,6: 0,2258 3º. Área entre -∞ y 900 : 0,5 + 0,2258 = 0,7258 Probabilidad: 72,58% F1 Área desde -∞ a 900 Área desde -∞ a 1000 Probabilidad de obtener un resultado menor de 1000: 1º. Cálculo de z: 1,6 2º. Área entre el valor medio y z=1,6: 0,4452 3º. Área entre -∞ y 1000 : 0,5 + 0,4452 = Probabilidad: 94,52% Se muestran dos casos concretos de cálculo de la probabilidad de obtener valores comprendidos en ciertos intervalos. N. Campillo Seva

23 2.2. INTERVALOS DE CONFIANZA (IC)
La t de Student ¿Para qué se utiliza? Para expresar intervalos de confianza Para comparar medias W.S. Gosset, Biometrika 1908, 6, 1 F1 ¿Cómo se calculan los intervalos de confianza? Al ↑ n, ↓ la incertidumbre Disponiendo de un número limitado de datos podemos hallar la media muestral y la desviación estándar muestral, pero no μ y σ. El intervalo de confianza es una expresión que me dice que la verdadera media (μ) está probablemente a una cierta distancia de la media muestral medida. Al ↑ s, ↑ la incertidumbre Al ↑ el nivel de confianza, ↑ t y por tanto ↑ la incertidumbre La t de Student se usa muy frecuentemente para expresar intervalos de confianza y para comparar resultados de diferentes experimentos. Esta herramienta se podría utilizar para calcular la probabilidad de que el recuento de glóbulos rojos de un paciente se encuentre dentro del intervalo “normal”. ¿Cómo se calculan intervalos de confianza? Si se dispone de un número limitado de medidas, que es lo normal en análisis químico, no podemos hallar la verdadera media de la población (µ) ni la verdadera desviación estándar (σ). Lo que podemos determinar es la media muestral y la desviación estándar muestral. El intervalo de confianza es una expresión que me informa de que la verdadera media µ, está probablemente a una cierta distancia de la media obtenida experimentalmente. El intervalo de confianza de µ viene dado por una ecuación matemática, donde el valor de t se obtiene a partir de la tabla de t de Student (diapositiva 24) para (n-1) grados de libertad. A partir de la ecuación del intervalo de confianza se observa claramente que se puede reducir la incertidumbre aumentando el número de análisis (n). N. Campillo Seva

24 Valores de la t de Student
Grados de libertad Nivel de confianza, % 50 90 95 98 99 99,5 99,9 1 1,000 6,314 12,706 31,821 63,656 127,321 636,578 2 0,816 2,920 4,303 6,965 9,925 14,089 31,598 3 0,765 2,353 3,182 4,541 5,841 7,453 12,924 4 0,741 2,132 2,776 3,747 4,604 5,598 8,610 5 0,727 2,015 2,571 3,365 4,032 4,773 6,869 6 0,718 1,943 2,447 3,143 3,707 4,317 5,959 7 0,711 1,895 2,365 2,998 3,500 4,029 5,408 8 0,706 1,860 2,306 2,896 3,355 3,832 5,041 9 0,703 1,833 2,262 2,821 3,250 3,690 4,781 10 0,700 1,812 2,228 2,764 3,169 3,581 4,587 15 0,691 1,753 2,131 2,602 2,947 3,252 4,073 20 0,687 1,725 2,086 2,528 2,845 3,153 3,850 25 0,684 1,708 2,060 2,485 2,787 3,078 3,725 30 0,683 1,697 2,042 2,457 2,750 3,030 3,646 40 0,681 1,684 2,021 2,423 2,704 2,971 3,551 60 0,679 1,671 2,000 2,390 2,660 2,915 3,460 120 0,677 1,658 1,980 2,358 2,617 2,860 3,373 0,674 1,645 1,960 2,326 2,576 2,807 3,291 N. Campillo Seva

25 INFLUENCIA DEL NIVEL DE CONFIANZA EN EL “IC” OBTENIDO
Ejercicio: Contenido de hidratos de C en una glicoproteína 12,6; 11,9; 13,0; 12,7 y 12,5 % (m/m) Calcule el intervalo de confianza del 50% 1º. Cálculo de: x= 12,54 y e=0,40 2º. Buscamos t para 50% y (n-1): 0,741 3º. Aplicamos la fórmula: µ = 12,54 (±0,13) CONCLUSIÓN: Existe un 50% de probabilidad de que la verdadera media (µ) esté en el intervalo de 12,41 a 12,67. Se presenta un ejercicio para clarificar el cálculo de intervalos de confianza: La determinación del contenido de hidratos de carbono en una glicoproteína, donde se obtienen los resultados replicados: 12,6; 11,9; 13,0; 12,7 y 12,5 % (m/m). Halle el intervalo de confianza del 50% del contenido en glucosa. ¿Qué significan el resultado obtenido? Que existe un 50% de probabilidad de que la verdadera media (µ) esté en el intervalo obtenido. Si se incrementa el nivel de confianza, ¿cómo afectará a la amplitud del nuevo intervalo de confianza? ¿Cómo se modifica el IC al aumentar el nivel de confianza? N. Campillo Seva

26 Contenido de carbohidratos
F1 Cálculo del IC al nivel de confianza del 90% 1º. Cálculo de: x= 12,54 y s=0,40 2º. Buscamos ttabulada para 90% y (n-1): 2,132 3º. Aplicamos la fórmula: µ = 12,54 (±0,38) 50% de probabilidad de que el verdadero valor se encuentre en este intervalo 90% de probabilidad de que el verdadero valor se encuentre en este intervalo Existe un 90% de probabilidad de que la verdadera media (µ) se encuentre en el intervalo comprendido 12,16 a 12,92. Contenido de carbohidratos Si se incrementa el nivel de confianza la amplitud del intervalo también lo hará, si queremos aumentar la probabilidad de obtener la verdadera media, lógicamente se ampliará el intervalo aumentando la probabilidad de contener dicho valor. CONCLUSIÓN: Para un determinado experimento al aumentar el nivel de confianza, la amplitud del intervalo de confianza también aumenta Análisis Químico Cuantitativo © 2007 Reverté N. Campillo Seva

27 INFLUENCIA DEL Nº DE MEDIDAS EN EL “IC” OBTENIDO
Medimos 5 veces el volumen de un recipiente Media Media 6, , ,374 6, , ,377 ± Desviación estándar 6,3746 (±0,0018) mL Desviación estándar Intervalo de confianza (90%) para 5 medidas: 6,3746 (±0,0017) mL Intervalo de confianza del 90% para 5 medidas Intervalo de confianza del 90% para 5 medidas El número de medidas también influye en la amplitud del intervalo de confianza. Cuantas más veces se mide una cantidad, más confianza se tiene que el valor de la media de las medidas hechas esté próximo a la verdadera media de la población n. De hecho, la incertidumbre disminuye en proporción a 1/(n)1/2, siendo n el número de medidas. 6,3746 ± 0,0018 mL 6,3746 (±0,0007) mL Intervalo de confianza (90%): 6,3746 ± 0,0007 Intervalo de confianza del 90% para 21 medidas Inº F1 N. Campillo Seva

28 INFLUENCIA DE LA DESVIACIÓN ESTÁNDAR EN EL “IC” OBTENIDO
Medimos el contenido de C en una glicoproteína mediante dos técnicas analíticas diferentes Técnica B Técnica A n = 5 12,54 (±0,70) n = 5 12,54 (±0,40) Intervalos de confianza al 90% Si mantenemos constante el número de medidas y el nivel de confianza, se cumplirá que a mayor desviación estándar mayor será la amplitud del intervalo de confianza obtenido. µ = 12,54 (±0,67) µ = 12,54 (±0,13) CONCLUSIÓN: A mayor desviación estándar, mayor será la amplitud del intervalo de confianza N. Campillo Seva

29 De partida los valores medios de los dos conjuntos NO son diferentes
2.3. Comparación de medidas mediante la t de Student Procedimiento: Comparamos dos conjuntos de medidas y concluimos si son o no diferentes. Se comprueba la “HIPÓTESIS NULA”: De partida los valores medios de los dos conjuntos NO son diferentes Los errores aleatorios son inevitables Imposible que 2 valores sean idénticos El test t se utiliza para comparar dos conjuntos de medidas y poder afirmar si son o no diferentes. Se trata de comprobar la “hipótesis nula”, o sea que partimos de afirmar que los valores medios de dos series de medidas no son diferentes. Idénticos no pueden ser, puesto que los errores aleatorios son inevitables. De manera que la estadística predice una probabilidad de que la diferencia entre las dos medidas pueda deberse a dichos errores aleatorios. Si hay menos de un 5% de probabilidad de que la diferencia se deba a errores aleatorios, se suele rechazar la hipótesis nula. Según este criterio se tendrá una probabilidad del 95% de que la conclusión sea correcta. Nos preguntamos: ¿qué probabilidad existe de que la diferencia se deba sólo a errores aleatorios? - Si existe menos de un 5% de probabilidad, se rechaza la hipótesis nula. - Por tanto, se tendrá un 95% de probabilidad de que los dos conjuntos no sean diferentes. N. Campillo Seva

30 Existen tres casos que se tratan de forma diferente:
Se mide una cantidad “n” veces y se obtiene el valor medio ( ) y la desviación estándar (s). Se compara el resultado obtenido con un resultado conocido y aceptado. Si la media obtenida no concuerda exactamente con el resultado conocido hay que comprobar si coincide o no el resultado medio con el conocido dentro del error experimental. CASO 2 Se mide una cantidad varias veces con dos métodos diferentes, obteniéndose para cada uno de ellos su valor medio ( ) y su desviación estándar (s1 y s2). Existen tres casos que se tratan de forma algo diferente, tal y como se detalla en la diapositiva. Se comprueba si concuerdan entre sí los dos resultados dentro del error experimental. CASO 3 Se dispone de “n” muestras diferentes que son medidas una única vez mediante dos métodos diferentes (A y B). Se comprueba si concuerdan los dos métodos dentro del error experimental o son sistemáticamente diferentes.

31 PATRÓN DE APLICACIÓN DE LOS TESTS DE COMPARACIÓN DE MEDIDAS
Caso 1 1. Selección del tipo de caso Caso 2 Caso 3 2. Cálculo de t tcalculada 3. Extracción del valor tabulado de t según cada caso particular según la tabla expuesta en la diapositiva nº 24 (Si no se especifica lo contrario se obtendrá para un nivel de confianza del 95%) ttabulada 4. Comparación de los valores de t: ● Si tcalculada > ttabulada Los resultados obtenidos son significativamente diferentes al nivel de confianza del 95% ● Si tcalculada < ttabulada Los resultados obtenidos no son significativamente Para la aplicación de los casos puede aplicarse un patrón común que consiste en las cuatro etapas detalladas en la diapositiva. N. Campillo Seva

32 CASO 1: COMPARACIÓN DE UN RESULTADO MEDIDO CON UN VALOR CONOCIDO
Ej. Queremos validar un nuevo analítico para la determinación de Se en orina: Analizamos mediante dicho método un material de referencia certificado National Institute Standard Technology Standard Reference Material NIST-SRM Comparamos con un resultado conocido y aceptado NIST SRM 144a NIST SRM 144a 27,6 29,3 28,1 28,9 n=4 28,5 (±0,8) Se: 30,1 (±0,9) ng/mL El valor medio obtenido (28,5) no concuerda exactamente con el resultado aceptado (30,1) ¿Coincide o no el resultado obtenido con el conocido dentro del error experimental? Supongamos el caso concreto en el que se compró una muestra de orina sintética que correspondía a un material estándar de referencia certificado por el NIST (National Institute Standard Technology) con un contenido en selenio de (30,1 ± 0,9) ng/mL. Se pretende validar un nuevo método analítico para la determinación de selenio en muestras de orina, para ello se analiza dicho material de referencia mediante el método a validar. Siendo los valores obtenidos para 4 alícuotas del material de referencia: 27,6; 29,3; 28,1 y 28,9 ng/mL. Dado que el valor medio de estas cuatro medidas (28,5 ng/mL) no coincide exactamente con el valor certificado (valor verdadero o aceptado, en este caso 30,1 ng/mL), es necesario aplicar las fórmulas correspondientes a este caso para calcular el valor de t. Ya que el valor de ttabulada (3,182) es menor que el de t calculada podemos afirmar que para este caso concreto existen diferencias significativas al nivel de confianza del 95% entre los dos resultados (el obtenido y el certificado), o lo que es lo mismo la probabilidad de que dichos valores sean iguales es inferior al 5%. Se calcula t y, si tcalculada > ttabulada a un nivel de confianza del 95%, se considera que los dos resultados son diferentes Existen diferencias significativas al nivel de confianza del 95% entre los dos resultados ttabulada (n-1=3) = 3,182 N. Campillo Seva

33 entre los dos resultados
CASO 2: COMPARACIÓN DE MEDIDAS REPLICADAS Ej. Medimos Se en una única muestra de orina mediante dos métodos diferentes A y B: Método A (ETAAS): 45,21; 47,22; 44,91; 46,38 x1 ± s1 x2 ± s2 45,93 ± 1,07 Método B (HG-AAS): 41,28; 43,22; 44,81; 42,35 42,59 ± 1,48 ¿Concuerdan entre sí los dos resultados obtenidos dentro del error experimental? Se calcula t y, si tcalculada > ttabulada a un nivel de confianza del 95%, se considera que los dos resultados son diferentes Se propone ahora el caso en el que se mide el contenido de selenio en una única muestra de orina, mediante dos métodos analíticos diferentes, por ejemplo espectrometría de absorción atómica con atomización electrotérmica (ETAAS) y espectrometría de absorción atómica con generación de hidruros (HG-AAS). En el caso propuesto se llevan a cabo cuatro medidas con cada técnica. Una vez calculados el valor medio y la desviación estándar para cada grupo de medidas, se plantea la pregunta ¿Concuerdan entre sí los dos resultados obtenidos dentro del error experimental? Para responder a esta pregunta se calcula el valor de scombinada mediante la ecuación correspondiente y seguidamente el valor de tcalculada, que se comparará con el valor tabulado de t para (n1 + n2 -2) grados de libertad. En el caso propuesto el número de medidas llevadas a cabo con cada método es el mismo, n1=n2, pero podrían ser diferentes. Dado que tcalculada > ttabulada en este caso particular podemos afirmar que existen diferencias significativas al nivel de confianza del 95% entre los dos resultados. = ttabulada (n1+n2-2, 95%) = 2,447 Dado que tcalculada > ttabulada : Existen diferencias significativas al nivel de confianza del 95% entre los dos resultados N. Campillo Seva

34 CASO 3: COMPARACIÓN DE PARES DE MEDIDAS
Ej. Realizamos una única medida de Se en varias muestras diferentes de orina mediante dos técnicas analíticas diferentes A y B: Muestra Concentración Se, ng/mL Técnica A ETAAS Técnica B HG-AAS Diferencia, di 1 30,12 30,41 -0,29 2 42,17 45,32 -3,15 3 26,80 26,19 0,61 4 31,03 31,42 -0,39 Media = -0,805 ¿Son significativamente diferentes los resultados obtenidos mediante estas técnicas? Aplicamos el test de las diferencias individuales En este caso se trata de dos métodos analíticos diferentes con los que se hace una única medida de cada de las muestras bajo análisis. No se duplica ninguna medida. En el caso propuesto ahora llevamos a cabo una única medida de selenio en cuatro muestras diferentes de orina mediante dos métodos diferentes de análisis. El método A ha aportado resultados más bajos que el B en tres de las muestras analizadas. ¿Son sistemáticamente diferentes ambos métodos?. Aplicamos el test de las diferencias individuales entre los resultados de cada muestra, calculando el valor de t y comparándolo con el tabulado. En el caso aquí propuesto, dado que tcalculada < ttabulada (al 95%de nivel de confianza) afirmamos que entre estas dos técnicas no existen diferencias significativas al nivel de confianza citado. ttabulada (n-1, 95%) = 3,182 Dado que tcalculada < ttabulada (al 95%de nivel de confianza) afirmamos que entre estas dos técnicas NO existen diferencias significativas al nivel de confianza citado. N. Campillo Seva

35 2.4. COMPARACIÓN DE DESVIACIONES ESTÁNDAR CON EL test F
Para decidir si dos conjuntos de medidas son significativamente diferentes entre sí se utiliza el test t, pero si lo que queremos comparar son las desviaciones estándar de dos conjuntos de medidas: Test F: Informa si dos desviaciones estándar son significativamente diferentes entre sí Aplicación del test F: 1. Cálculo de F según la ecuación: Se elige s1 y s2 de manera que siempre F ≥ 1 2. Extracción del valor tabulado de F, considerando los grados de libertad (n-1) para cada conjunto de medidas (tabla diapositiva 36) El test F nos informa si dos desviaciones estándar son significativamente diferentes entre sí. F es el cociente de los cuadrados de las desviaciones estándar, para su cálculo se coloca siempre en el numerador la desviación estándar mayor, de modo que se cumpla que el valor calculado para F sea mayor o igual a 1. El valor de F tabulado se extrae de la tabla que aparece en la siguiente diapositiva. Si Fcalculada > Ftabulada, la diferencia entre las desviaciones estándar sí es significativa al 95% de confianza, que corresponde a los valores tabulados. 3. Comparación de los valores de F: ● Si Fcalculada > Ftabulada Las desviaciones estándar difieren entre sí a un nivel de confianza del 95% ● Si Fcalculada < Ftabulada Las desviaciones estándar no difieren entre sí N. Campillo Seva

36 Valores críticos de F para un nivel de confianza del 95%
Grados de libertad de s2 Grados de libertad de s1 2 3 4 5 6 7 8 9 10 12 15 20 30 19,0 9,55 6,94 5,79 19,2 9,28 6,59 5,41 9,12 6,39 5,19 19,3 9,01 6,26 5,05 8,94 6,16 4,95 19,4 8,89 6,09 4,88 8,84 6,04 4,82 8,81 6,00 4,77 8,79 5,96 4,74 8,74 5,91 4,68 8,70 5,86 4,62 8,66 5,80 4,56 19,5 8,62 5,75 4,50 8,53 5,63 4,36 5,14 4,46 4,26 4,10 4,76 4,35 4,07 3,86 3,71 4,53 4,12 3,84 3,63 3,48 4,39 3,97 3,69 3,33 4,28 3,87 3,58 3,37 3,22 4,21 3,79 3,50 3,29 3,14 4,15 3,73 3,44 3,23 3,07 3,68 3,39 3,18 3,02 4,06 3,64 3,35 2,98 4,00 3,28 2,91 3,94 3,51 3,01 2,84 3,15 2,94 2,77 3,81 3,38 3,08 2,86 2,70 3,67 2,93 2,71 2,54 11 13 14 3,98 3,88 3,74 3,59 3,49 3,41 3,34 3,36 3,26 3,11 3,06 3,20 2,96 2,90 3,10 3,00 2,92 2,85 2,79 2,83 2,76 2,95 2,64 2,80 2,65 2,59 2,75 2,67 2,60 2,69 2,53 2,48 2,72 2,62 2,46 2,40 2,39 2,33 2,57 2,47 2,38 2,31 2,25 2,30 2,21 2,13 2,07 16 17 18 19 3,56 3,52 3,24 3,16 3,13 2,87 2,81 2,74 2,66 2,63 2,61 2,58 2,51 2,55 2,45 2,49 2,42 2,41 2,35 2,43 2,28 2,27 2,23 2,20 2,19 2,16 2,12 2,15 2,11 2,04 2,01 1,96 1,92 1,88 1,84 3,32 2,37 2,10 1,94 1,83 2,09 1,75 1,67 1,93 1,57 1,46 1,62 1,00 N. Campillo Seva

37 2.5. Test Q DE DATOS SOSPECHOSOS
¿Qué hacer cuando un dato no es coherente con el resto de una serie? El test Q ayuda a decidir si mantener o desechar dicho dato Consideremos los siguientes 5 resultados de un análisis: 130,1; 130,7; 128,8; 137,8 y 131,4 ¿Hemos de considerar o descartar el resultado 137,8? Aplicación del test Q: Se ordenan los datos en orden creciente: 2. Cálculo de Q según la ecuación: 128, , , , ,8 Cuando un dato no es coherente con los restantes, se puede usar el test Q como ayuda para decidir si se mantiene o se desecha dicho dato sospechoso. Consideremos los 5 resultados siguientes: 130,1; 130,7; 128,8; 137,8 y 131,4. ¿Se rechaza o se mantiene el valor 137,8?. Para aplicar el test Q, se ordenan los datos en orden creciente y se calcula Q, sabiendo que el recorrido es la dispersión máxima entre los datos y la divergencia la diferencia entre el valor sospechoso y el valor más próximo. Divergencia = Diferencia entre el valor sospechoso y el más próximo = 6,4 128, , , , ,8 Recorrido = Dispersión máxima entre los datos = 9 N. Campillo Seva

38 En el ejemplo propuesto, dado que Qcalculada > Qtabulada,
3. Extracción de Q tabulada (tabla diapositiva 39) Qtabulada (n=5) = 0,64 4. Comparación de los valores de Q: ● Si Qcalculada > Qtabulada El valor sospechoso debe ser descartado ● Si Qcalculada < Qtabulada El valor sospechoso no debe descartarse, existiendo una probabilidad mayor del 10% de que dicho valor sea un miembro más de la población como el resto de valores de la serie. En el ejemplo propuesto, dado que Qcalculada > Qtabulada, el valor 137,8 debe descartarse Seguidamente se obtiene el valor tabulado de Q, según los datos de la tabla de valores de Q para el rechazo de datos, que se muestra en la siguiente diapositiva, para finalmente comparar los valores de Q. Si Qcalculada > Qtabulada, se descarta el punto sospechoso. En el caso propuesto el dato sospechoso debe descartarse, con un 90% de confianza dado que los valores de Q se hallan tabulados para dicho nivel. En realidad la decisión final depende de uno mismo, pues hay quien afirma que no se debe descartar nunca un dato a no ser que se sepa que existe un error de procedimiento que condujo a esa medida particular; hay quien repite la medida sospechosa varias veces hasta asegurarse si está o no realmente fuera de los esperable. N. Campillo Seva

39 Valores de Q para el rechazo de datos
Q (nivel de confianza 90%) Nº de observaciones 0,76 4 0,64 5 0,56 6 0,51 7 0,47 8 0,44 9 0,41 10 N. Campillo Seva

40 CRÉDITOS DE LAS ILUSTRACIONES – PICTURES COPYRIGHTS
Logo Portada OCW-UM. Autor: Universidad de Murcia. Dirección web: Página 4, F1. Dirección web: Página 4, F2. Dirección web: Página 10, F1. Autor: Original uploader Gmhofmann from wikipedia. Dirección web: Página 11, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 14, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 17, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 18, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 19, F1. Dirección web: Página 20, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 22, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. Página 23, F1. Dirección web: Páginas 26 y 27, F1. Fuente: “Quantitative Chemical Analysis”, Seventh Edition, © 2007 W.H. Freeman and Company. N. Campillo Seva


Descargar ppt "TEMA 3: INTRODUCCIÓN A LA QUIMIOMETRÍA Asignatura: Análisis Químico"

Presentaciones similares


Anuncios Google