La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

ESTADÍSTICA EN QUÍMICA ANALÍTICA

Presentaciones similares


Presentación del tema: "ESTADÍSTICA EN QUÍMICA ANALÍTICA"— Transcripción de la presentación:

1 ESTADÍSTICA EN QUÍMICA ANALÍTICA
Gloria María Mejía Z calidadbioquimica.com.ar/error.htm

2 IMPORTANCIA DE LA ESTADÍSTICA Y
LA QUIMIOMETRÍA EN LA QUÍMICA ANALÍTICA Durante la realización de una análisis cuantitativo es muy importante tomar en cuenta todas las variables que pueden afectar nuestro resultado, dentro de estos están los factores provocados por los instrumentos utilizados y los errores provocados por quien maneja el material. En el reporte de cualquier análisis químico, es importante tomar en cuenta este tipo de errores , hacer un análisis de los resultados y así se podrá concluir sobre él. Gloria María Mejía Z

3 ¿ Qué es estadística?  La estadística es una colección de métodos para planificar y realizar  experimentos, obtener datos y luego analizar, interpretar, y formular una conclusión basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar información numérica  o cualitativa, de manera que pueda llevar a conclusiones válidas. Gloria María Mejía Z

4 Gloria María Mejía Z ESTADISTICA
Es la ciencia que recopila, organiza e interpreta la información numérica o cualitativa DESCRIPTIVA Es la ciencia que interpreta información de manera que pueda llevar a conclusiones válidas. INFERENCIAL Gloria María Mejía Z

5 Unidad 1: Estadística Descriptiva. Arturo A. Alvarado S. (ITSY 2006)
La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La Estadística es la Ciencia de la Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Descriptiva Probabilidad Inferencia Unidad 1: Estadística Descriptiva Arturo A. Alvarado S. (ITSY 2006) Gloria María Mejía Z

6 Unidad 1: Estadística Descriptiva. Arturo A. Alvarado S. (ITSY 2006)
DATOS NO AGRUPADOS Media aritmética Mediana Moda Percentiles (posición) Medidas de tendencia central Rango (amplitud) Rango intercuartílico Varianza Coef. de variación Medidas de dispersión Unidad 1: Estadística Descriptiva Arturo A. Alvarado S. (ITSY 2006) Gloria María Mejía Z

7 Gloria María Mejía Z MAGNITUD MESURANDO O MEDIDA VARIABLE ANALSIS
Atributo o propiedad que puede ser medida Ejemplos de magnitudes : La longitud, la masa, concentración de una solución, Absortividad molar volumen de un líquido, absorbancia, etc. MESURANDO O MEDIDA Magnitud de un objeto específico que estamos interesado en medir Es la determinación experimental de la MAGNITUD VARIABLE Toda MAGNITUD que permite diferenciar entre si a los componentes de una población ANALSIS Proceso que nos da una información física o química acerca de los componentes de una muestra Gloria María Mejía Z

8 Medidas de tendencia central
Mediana En una serie de datos ordenados (creciente o decreciente) es la puntuación o valor central de la distribución estadística Datos no agrupados Si el nº de datos es impar: valor central Si el nº de datos es par: media aritmética de los 2 puntos centrales Gloria María Mejía Z

9 Medidas de tendencia central
Mediana Características Menos sensible que la media a la variación de las puntuaciones. Se puede calcular aunque algún intervalo carezca de límite. Más representativa que la media cuando puntuaciones muy extremas. Gloria María Mejía Z

10 Medidas de tendencia central
Moda Valor de la variable que más veces se repite en una serie estadística (máxima frecuencia) Distribuciones: Unimodales o multimodales Marca de clase (en intervalos) Características: Sencilla de calcular Se puede calcular si algún intervalo no tiene límites Poco representativa Gloria María Mejía Z

11 Medidas de tendencia central
Media Suma de todos los valores de una variable dividida por el número total de valores Sólo en variables cuantitativas X =  xi / N Gloria María Mejía Z

12 Medidas de tendencia central
Media. Cálculo Datos no agrupados: aplicar fórmula Datos agrupados En tabla de frecuencia: Suma de todos los valores multiplicados por sus frecuencias y dividido por el nº total. X =  xi fi / N Gloria María Mejía Z

13 Medidas de tendencia central
Media Características La media es sensible a la variación de las puntuaciones. No se puede calcular si algún intervalo es de límite abierto. No es recomendable si valores muy extremos Gloria María Mejía Z

14 Medidas de dispersión Reflejan la dispersión, oscilación de los datos, respecto al fenómeno estudiado. Complementan las de tendencia central para la descripción de una distribución Gloria María Mejía Z

15 Medidas de dispersión Amplitud o rango
Diferencia entre el valor más alto y más bajo de la distribución. Ofrece poca información sobre la agrupación de los datos. Indica el “campo de variabilidad”. Suele acompañar a la moda. Gloria María Mejía Z

16 Medidas de dispersión Varianza S2 =  (xi – x)2 / N
Junto a la desviación típica, la que mejor expresa la variabilidad del fenómeno Media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética S2 =  (xi – x)2 / N S2 =  xi2 / N – x2 Para datos agrupados: S2 =  fi(xi – x) 2 / N S2 =  fixi2 / N – x2 Gloria María Mejía Z

17 Medidas de dispersión Desviación típica
Es la raíz cuadrada de la varianza S2 =  xi2 / N – x2 Para datos agrupados: S2 =  fixi2 / N –x2 Gloria María Mejía Z

18 Medidas de dispersión Varianza y desviación típica Características
Ambas toman siempre valores positivos. Si todos los datos de una distribución son iguales entre sí, toman el valor 0. Sólo son aplicables a variables cuantitativas La que más se suele usar es la desviación típica. Si los datos están muy dispersos, la desviación típica será muy grande. Gloria María Mejía Z

19 Medidas de dispersión Coeficiente de variación de Pearson
Para poder comparar la dispersión entre 2 ó más variables entre sí, o una misma variable en 2 ó más grupos estudiados Es una medida relativa: Relaciona la media con la desviación típica CV = S / X . 100 Gloria María Mejía Z

20 Gloria María Mejía Z calidadbioquimica.com.ar/error.htm

21 Gloria María Mejía Z

22 Gloria María Mejía Z

23 Gloria María Mejía Z

24 Gloria María Mejía Z

25 DISTRIBUCIO DE FRECUENCIAS
En una distribución de datos estos pueden estar o no agrupados. DATOS AGRUPADOS EN INTERVALOS: DATOS NO AGRUPADOS EN INTERVALOS: SUPUESTO DE CONCENTRACION EN EL PUNTO MEDIO (Xi): Gloria María Mejía Z

26 LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS
¿CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?: 1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL. 2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25 LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS 3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN DE PUNTO MEDIO. Gloria María Mejía Z

27 LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION NORMAL). CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS. Gloria María Mejía Z

28 La distribución normal
Datos simétricos: coinciden la media, la mediana y la moda Media Mediana Moda f(X) X En el caso de la distribución normal, coinciden la media, la mediana y la moda. Una forma empírica de juzgar si una distribución es simétrica consiste en comparar la mediana y la media. Gloria María Mejía Z

29 Propiedades de la distribución normal:
El área bajo la curva aproximado del promedio μ a más o menos una desviación estándar (1σ) es de 0.68, a más o menos 2σ es de y a más o menos 3σ es de 0.99. (Las propiedades continuan en la próxima lámina) Gloria María Mejía Z

30 Propiedades de la distribución normal:
La forma de la campana de Gauss depende de los parámetros μ y σ.  Tiene una única moda que coincide con su media y su mediana. La curva normal es asintótica al eje de X.  Es simétrica con respecto a su media μ .  Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. Gloria María Mejía Z

31 En resumen Podemos concluir que hay una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su varianza.  La desviación estándar (σ ) determina el grado de apuntamiento de la curva.  Cuanto mayor sea el valor de σ, más se dispersarán los datos en torno a la media y la curva será más plana.  La media indica la posición de la campana, de modo que para diferentes valores de μ la gráfica es desplazada a lo largo del eje horizontal. De entre todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de media 0 y varianza 1.  Gloria María Mejía Z

32 ERRORES EN LOS ANALISIS QUIMICOS
Es imposible efectuar análisis químicos totalmente libres de errores o incertidumbres. La fiabilidad de un resultado se analiza de diferentes maneras Se analizan patrones de composición conocida Se aplican pruebas estadísticas a los datos Gloria María Mejía Z

33 ERROR: es la medida del sesgo en el resultado de una medición.
Gloria María Mejía Z En ciencias e ingeniería, el concepto de error tiene un significado diferente del uso habitual de este término. Coloquialmente, es usual el empleo del término error como análogo o equivalente a equivocación. En ciencia e ingeniería, el error, está más bien asociado al concepto de incerteza, incertidumbre, en la determinación del resultado de una medición. ERROR: es la medida del sesgo en el resultado de una medición. INCERTIDUMBRE: es el intervalo o rango de los valores posibles de una medida. Incluye tanto los errores sistemáticos como aleatorios. La incertidumbre de un resultado es bien diferente de la precisión, ésta da una medida del error aleatorio.

34 Error: Es la medida del sesgo en el resultado de una medición
Incertidumbre: Es el intervalo o rango de los valores posibles de una medida. Incluye tanto errores aleatorios como sistemáticos Más precisamente, lo que procuramos en toda medición es conocer las cotas (o límites probabilísticos) de estas incertezas. La incertidumbre de un resultado es bien diferente de la precisión, ésta da una medida del error aleatorio. Gloria María Mejía Z

35 Errores Gloria María Mejía Z Groseros o accidentales
Son errores que son tan importantes que no existe alternativa real que abandonar el experimento y empezar de nuevo por completo. Aleatorio Estos provocan que los resultados individuales difieran uno del otro de manera que caigan a ambos lados del valor medio. Estos errores afectan la precisión de un experimento. Este tipo de errores son los que comete el operador del instrumento utilizado. Sistemáticos Provocan que todos los resultados sean erróneos en el mismo sentido, son demasiado grandes, y se denomina también sesgo de la medida. Este tipo de error es responsabilidad del material empleado y de su origen y presión de fabricación. Gloria María Mejía Z

36 Gloria María Mejía Z Sistemáticos
Determinados: Posibles de evitar y o de corregir. Pueden ser constantes como pesar en una balanza descalibrada, o variables. Aleatorios Indeterminados: A menudo se llaman accidentales. Estos errores se evidencian por pequeñas diferencias en mediciones sucesivas. Gloria María Mejía Z

37 Errores experimentales
Error absoluto.- Nos indica si medimos u obtuvimos mas o menos que el valor experimental, y en qué cantidad excedimos del valor real o qué cantidad nos faltó; esto según el signo de la sustracción. EA = valor experimental – valor teórico Error relativo.- Es una forma de conocer el porcentaje de error que obtuvimos en nuestros resultados. ER = (valor experimental – valor teórico) x 100 (valor teórico) Gloria María Mejía Z

38 Los errores presentes en un estudio analítico modifican:
• Precisión Es el grado de confianza con que se puede repetir un experimento y este puede dar los mismo resultados. Es utilizado como sinónimo de repetitibilidad. • Exactitud Es el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado. Gloria María Mejía Z

39 TERMINOS IMPORTANTES Media, Media aritmética y promedio (X) son términos sinónimos. Es la medida de tendencia central mas utilizada .Se obtiene dividiendo la suma de los valores de una serie y dividiendo por el numero de medidas del conjunto. Mediana es el resultado alrededor del cual se reparten los demás por igual. Si la serie es un numero impar la mediana es el numero de la mitad. Si la serie es un numero par se toma el promedio del par central después de haber ordenado la serie de menor a mayor.

40 TERMINOS IMPORTANTES Ejemplo: calcular la media y la mediana de 10.06, 10.20, 10.08, Media = X = = 10.11 4 Mediana = = 10.09 2 Gloria María Mejía Z

41 CIFRAS SIGNIFICATIVAS
Es el numero necesario de dígitos para expresar los resultados de una medición congruente con la precisión de medida. 237 : centenas, 3 decenas y 7 unidades El numero de cifras significativas incluye todos los dígitos que se conocen mas el primer digito incierto. Gloria María Mejía Z

42 El numero de cifras significativas en una medición es independiente de la colocación del punto decimal. Por ejemplo el numero : Este numero tiene cinco cifras significativas independiente dondese coloque el punto decimal. En este caso el cero si es una cifra significativa. En el numero el cero no se usa para localizar el punto decimal es significativo Gloria María Mejía Z

43 Ejemplos: 0.216 Tres Cifras significativas.
Cuatro cifras significativas. Tres cifras significativas Gloria María Mejía Z

44 TERMINOS IMPORTANTES Precisión.
El término precisión describe la reproducibilidad de los resultados y se puede definir como la concordancia que hay entre los valores numéricos de dos o más mediciones que se han realizado de idéntica manera. La precisión sólo depende de la distribución de los errores aleatorios y no se relaciona con el valor verdadero ni con el valor especificado. Gloria María Mejía Z

45 PRECISION Para describir la precisión de un conjunto de datos repetidos se utilizan tres términos muy conocidos: La desviación estándar, la varianza y el coeficiente de variación. Gloria María Mejía Z

46 La desviación estándar (DS/DE) es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Aunque esta fórmula es correcta, en la práctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 Gloria María Mejía Z

47 TERMINOS IMPORTANTES Desviación estándar S= Xi-X
METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION Desviación estándar S= Xi-X n-1 Desviación respecto a la media es la diferencia numérica entre un valor experimental y la media Varianza: S2 Coeficiente de variación. C.V = S/Media *100 Gloria María Mejía Z

48 TERMINOS IMPORTANTES Desviación estándar relativa (DER) : se calcula al dividir la desviación estándar entre la media del conjunto de datos. DER se expresa en partes por mil o en %. DER * 100% = CV. Dispersión (W): Es la diferencia entre el valor mas alto y el valor mas bajo del conjunto Gloria María Mejía Z

49 TERMINOS IMPORTANTES EXACTITUD : El término denota el grado de coincidencia del resultado de una medición con el valor verdadero o aceptado de la misma y se expresa en función del error. La exactitud implica una comparación con el valor verdadero o aceptado como tal. Cuando no se conoce el valor verdadero se debe usar un valor aceptado. Gloria María Mejía Z

50 TERMINOS IMPORTANTES METODOS PARA MEDIR LA EXACTITUD
Error absoluto: Es la diferencia entre el valor experimental y el valor real. Error relativo: Es el error absoluto dividido por la cantidad medida. Ejemplo: Una muestra tiene 20.34% de Fe y un analista encuentra que es 20.44%. Error Absoluto = = 0.10% Error relativo = 0.1/20.34 = = 4.9 partes por mil Gloria María Mejía Z

51 TERMINOS IMPORTANTES En términos generales la exactitud supone una comparación con un valor verdadero o aceptado como tal, la precisión indica la concordancia entre las medidas que han sido realizadas de una misma forma. Gloria María Mejía Z

52 Esquema gráfico para comprender la relación entre exactitud y precisión
En C existe buena precisión, pero no buena exactitud; en A buena exactitud y precisión, y en B mala exactitud y precisión. Gloria María Mejía Z

53 Diagrama precisión y exactitud
Gloria María Mejía Z

54 EVALUACION DE LOS DATOS ANALITICOS
ESTUDIANTE RESULTADOS COMENTARIO DE UNA TITULACION A Preciso pero inexacto 10.09 10.10 10.12 B 10.14 Exacto pero impreciso 10.21 10.19 C Inexacto e impreciso 10.05 9.78 Gloria María Mejía Z

55 EVALUACION DE LOS DATOS ANALITICOS
ESTUDIANTE RESULTADOS COMENTARIO DE UNA TITULACION 10.04 9.98 D EXACTO Y PRECISO Gloria María Mejía Z

56 TIPOS DE ERRORES EN DATOS EXPERIMENTALES
Bruto Aleatorios Sistemáticos Ocurre de manera = indeterminados = determinados Ocasional . suele ser Afectan la presicion Afectan la exactitud Grandes. Dan como o la reproducibilidad o sea la proxim al valor resultado valores verdadero. atípicos que difieren Los resultados caen Todos los resultados mucho de los demás a lado y lado de la X son erróneos en el mismo sentido. Gloria María Mejía Z

57 ERRORES DETERMINADOS O SISTEMATICOS
FUENTES DE ERRORES SISTEMÁTICOS Errores instrumentales: Calibraciones deficientes Errores del método: Dificiles de identificar Errores personales: Descuido, Falta de atención Gloria María Mejía Z

58 EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS
Los errores sistemáticos pueden ser constantes o proporcionales En los errores constantes el error absoluto es invariable con el tamaño de la muestra ,mientras el error relativo cambia al modificar dicho tamaño. Los errores proporcionales aumentan o disminuyen según el tamaño de la muestra. Con los errores proporcionales el error absoluto varia con el tamaño de la muestra, en cambio el error relativo permanece constante. Gloria María Mejía Z

59 EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS
Los errores sistemáticos pueden ser constantes o proporcionales. En los errores constantes, el error absoluto es invariable con el tamaño de la muestra, mientras en el error relativo cambia al modificar el tamaño de la muestra. Los errores proporcionales aumentan o disminuyen según el tamaño de la muestra; con estos errores el error absoluto varia con el tamaño de la muestra en cambio el error relativo permanece constante. Gloria María Mejía Z

60 EVALUACION DE LOS DATOS ANALITICOS
Gloria María Mejía Z

61 EVALUACION DE LOS DATOS ANALITICOS
Los errores ocasionados por el amoniaco envasado durante mucho tiempo fueron constantes por que se utilizo el mismo volumen y el aporte de Si fue el mismo. El NH3 del envase recién utilizado fueron muy pequeños y proporcionales al tamaño de muestra. Gloria María Mejía Z

62 ERRORES ALEATORIOS Son la principal fuente de incertidumbre en una determinación. Muchas variables no controladas y de no fácil identificación causan errores aleatorios. El efecto acumulativo de las incertidumbres, aunque estas sean muy pequeñas, hace que las mediciones por duplicado de una serie fluctúen al azar. Gloria María Mejía Z

63 FUENTES DE LOS ERRORES ALEATORIOS
Los errores aleatorios obedecen una curva normal de error o curva de gauss. meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm Gloria María Mejía Z

64 meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm Gloria María Mejía Z

65 Distribución normal Al iniciar el análisis estadístico de una serie de datos, y después de la etapa de detección y corrección de errores, un primer paso consiste en describir la distribución de las variables estudiadas y, en particular, de los datos numéricos. Un modo es con la curva de distribución normal que muestra la frecuencia con que se repiten los datos. Gloria María Mejía Z

66 TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO
Los métodos estadísticos permiten categorizar y caracterizar los datos, y tomar decisiones objetivas en cuanto a su calidad e interpretación. Hay que diferenciar entre muestra y población o universo. ( caso del análisis de Ca en agua. La población seria un numero de medidas muy grande cercano al infinito). Las leyes de la estadística se dedujeron para usarlas en poblaciones. Para aplicarlas a muestras se debe hacer ajustes. Gloria María Mejía Z

67 TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO
Las curvas gaussianas se pueden representar por medio de una ecuación que tiene la media de la población µ, y la desviación estándar de la población σ. La media de la población es µ y la media de la muestra es X. Gloria María Mejía Z

68 Gloria María Mejía Z

69 Gloria María Mejía Z

70 EVALUACION DE METODOS ANALITICOS
Ejemplo 2. La N de una solución se calculo con 4 titulaciones por separado y los resultados fueron , , , y Calcular la X, la Mediana, El rango , La S. la desviación relativa y el C.V. X = ( )/4 = Mediana M= ( )/2 = Rango R = = 0.001 La desviación relativa= Sumatoria de (Xi-X)/4=0.0003 S= C.V = (0.0004/0.2043)*100 = 0.2% Gloria María Mejía Z

71 Gloria María Mejía Z

72 PRESENTACION DE LOS DATOS CALCULADOS
Siempre es necesario indicar el nivel de confianza de los datos. Es un rango de valores en los que con una probabilidad determinada está un valor verdadero poblacional. Generalmente son del 95% o 99%. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza α Gloria María Mejía Z

73 PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de un análisis realizado por dos métodos diferentes. Se trabaja con las X Se aplica el T de student. Plantea la hipótesis de que las dos X son iguales. La prueba T da una respuesta si o no a la hipótesis nula con cierta exactitud como del 95 o 99% Gloria María Mejía Z

74 Prueba de significancia
t = X1 – X n1n2 S n1+n2 Si t calculado es mayor que t de la tabla entonces los dos métodos son iguales Para poder calcular t hay que calcular primero la s de cada serie de datos Gloria María Mejía Z

75 Cuando se escoge el nivel de significación 0,05 (ó 5%), tenemos un 95% de confianza de que hemos adoptado la decisión correcta y una probabilidad 0,05 de ser falsa. Gloria María Mejía Z

76 Por lo general surgen dos preguntas:
Cómo determina si un valor es realmente un valor atípico y cómo decide si debe continuar o no con el análisis de datos? Uno de los problemas en el análisis de datos es manejar los valores atípicos dentro de un grupo de datos. Un valor atípico es una observación con un valor que no parece corresponderse con el resto de los valores en el grupo de datos. Por lo general surgen dos preguntas: ¿Es este valor realmente un valor atípico? ¿Puedo eliminar este valor y continuar con el análisis de datos? Gloria María Mejía Z

77 DATOS ATIPICOS Con respecto a la pregunta 2, debe saberse que las pruebas estadísticas se utilizan para identificar valores atípicos, no para retirarlos del grupo de datos. Técnicamente, una observación no debe retirarse a menos que una investigación halle una causa probable para justificar esta acción Gloria María Mejía Z

78 DATOS ATIPICOS Si en la investigación no se encuentra una causa probable, ¿qué debe hacerse? Un enfoque sería realizar un análisis de datos con el valor atípico y sin él. Si las conclusiones son diferentes, entonces se considera que el valor atípico tiene influencia y esto debería indicarse en el informe. Otra opción es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal como la mediana de la muestra en lugar de la media. Gloria María Mejía Z

79 RECHAZO DE DATOS Dos de las pruebas estadísticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atípicos comparados con los valores del grupo de datos. Gloria María Mejía Z

80 RECHAZO DE DATOS Estas técnicas están diseñadas para detectar un único valor atípico en un grupo de datos, y por lo tanto no son adecuadas para la detección de múltiples valores atípicos. Una técnica rigurosa y amplia para identificar eficazmente múltiples valores atípicos es el procedimiento para muchos valores atípicos con generalización extrema de la desviación de Student. Gloria María Mejía Z

81 DIXON Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 Ordenando los datos: 3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8 El tamaño de la muestra es 7, y la relación utilizada es el espacio entre el valor atípico (7.8) y su vecino más próximo (5.3) dividido por el espacio entre los valores más grandes y más pequeños en el grupo. Por lo tanto, el índice de Dixon es: (7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = 0.532 Gloria María Mejía Z

82 RECHAZO DE DATOS Este valor se compara con un valor crítico de una tabla, y el valor se declara valor atípico si supera ese valor crítico. Si Dcalculado>Dtabulado se rechaza el dato El valor tabulado depende del tamaño de la muestra, n, y de un nivel de confianza elegido, que es el riesgo de rechazar una observación válida. La tabla por lo general utiliza niveles de baja confianza tal como 1% o 5%. Para un n = 7 y un riesgo del 5%, el valor en la tabla es El índice de Dixon excede este valor crítico, indicando que el valor 7.8 es un valor atípico. Gloria María Mejía Z

83 DIXON La prueba de Dixon se usa en un número
pequeño de observaciones (menor a 26) y detecta elementos que se encuentren sesgados o que son extremos. Para aplicar la prueba de Dixon se requiere de un número de observaciones igual o mayor a 10. En el caso que las observaciones sean menores a 10 se utiliza como valor esperado el valor de preparación. Gloria María Mejía Z

84 GRUBBS La prueba de Grubbs utiliza una estadística de prueba, T, que es la diferencia absoluta entre el valor atípico, XO, y el promedio de la muestra (X) dividida por la desviación estándar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviación estándar de la muestra es = La estadística calculada de la prueba es: Gloria María Mejía Z

85 GRUBBS Para un n = 7 y un riesgo del 5%, el valor tabulado es y el TCalculado = 1.99 excede este valor crítico, indicando que el valor 7.8 es un valor atípico. Gloria María Mejía Z

86 TEST DE GRUBB PARA DATOS SOSPECHOSOS
Recomendado por las normas ISO G= Valor Sospechoso – X S (Con el valor sospechoso incluido) Si Gcalculada > Gtabulada el valor sospechoso se rechaza Gloria María Mejía Z

87 TEST Q DE DATOS SOSPECHOSOS
Aceptar o rechazar un resultado anómalo (outlier) Normalmente se producen al cometer errores o fallos en la metodología aplicada. Se ordenan los datos en forma creciente y se calcula Q Q = desvío = Diferencia entre el dato sospechosos y su vecino más cercano recorrido Diferencia numérica entre el dato de mayor valor y el de menor valor Si Qcalculada > Qtabulada el dato se rechaza Gloria María Mejía Z

88 Ejemplo: Al efectuar una serie de réplicas para determinar la concentración del ión sulfato en una muestra de agua para riego se obtuvieron los siguientes resultados. Determinar si la medida 6.0 es un valor rechazable. 1. Se ordenan los datos en orden de valor decreciente 6.0, 5.6, 5.5, 5.2, 5.0 Medida Valor 2. Se calcula Q Q= ( )/ ( ) =0.40 3. Se compara Q calculado con Q tabulado para 5 medidas y un nivel de confianza del 90. Qtab=0.64 0.40<0.64, luego el valor 6.0 no es rechazable Gloria María Mejía Z

89 DESCARTE DE DATOS Definir que tan grande es la Diferencia entre el valor sospechoso y los otros datos. Aplicar Prueba Q. Ordenar los datos Calcular el rango Encontrar la diferencia entre el resultado sospechosos y su vecino mas cercano 3. Dividir la diferencia obtenida en el paso 2 entre el Rango. Así se obtiene el coeficiente de descartacion Q. 4. Consultar la tabla de valores Q. Si el valor calculado es mayor que el de latabla el resultado se puede descartar con un 90% de confianza de que si se podia. Gloria María Mejía Z

90 Gloria María Mejía Z

91 DESCARTE DE DATOS EJEMPLO
4 Resultados de N de una solución fueron , , , Se podrá descartar ? X sin el = =0.0005 Q = =0.43 0.43 es menor que NO SE DESCARTA Gloria María Mejía Z

92 Gloria María Mejía Z

93 PRESENTACION DE LOS DATOS CALCULADOS
Un indicador de la calidad de los datos es la utilización de las cifras significativas. Cifras significativas: Son todos los dígitos que se conocen con certeza y el primer digito incierto. Por ejemplo tiene 4 cifras significativas (4, el ultimo digito, es incierto) Gloria María Mejía Z

94 PRESENTACION DE LOS DATOS CALCULADOS
El cero puede ser significativo o no según su ubicación en el numero. Un cero rodeado por otros dígitos siempre es significativo. Los ceros al final pueden o no ser significativos. 2.0 tiene dos cifras significativas tiene una cifra significativa. 2x103 tiene una. Gloria María Mejía Z

95 PRESENTACION DE LOS DATOS CALCULADOS
Para las sumas y las restas el resultado debe tener el mismo numero de decimales que el numero que tiene menos decimales. Cuando se suman o restan números con notación científica se debe expresar el resultado en la misma potencia de 10. En la multiplicación y la división se debe expresar el resultado con las cifras significativas del numero que tenga menor cifras significativas. Gloria María Mejía Z

96 PRESENTACION DE LOS DATOS CALCULADOS
Redondeo de datos: Se debe aproximar al numero mayor si el ultimo es mayor de 5 y al menor si el ultimo es menor de 5. se aproxima al numero par mas cercano . Queda 61.56 De todas maneras el resultado debe expresarse con la desviación estándar calculada. Gloria María Mejía Z

97 OBJETIVOS DEL MUESTREO
Estadísticamente los objetivos del proceso de muestreo son: 1. Obtener el valor medio 2. Obtener una varianza que sea una estimación de la varianza poblacional con limites de confianza validos para la media. Gloria María Mejía Z

98 VALIDACION DE METODOS ANALITICOS
Calidad de resultados Selectividad Analito en medio de interferencias Limite de detección Promedio de bcos +3(desviación) Limite de cuantificación 5 ò 10 L.D. Intervalo de trabajo Rango en que el método es exacto y preciso. Rango lineal Exactitud. Valor de referencia Precisión Desviación y CV Sensibilidad Pendiente % Recuperación. Adición de cantidades conocidas GRÁFICOS DE CONTROL. Gloria María Mejía Z

99 VALIDACION DE METODOS ANALITICOS
Curvas de calibración Linealidad Pendiente Sensibilidad Residuales Coeficiente de correlación Gloria María Mejía Z

100 VALIDACION DE METODOS ANALITICOS
Curvas de calibración: Mínimos Cuadrados Modelo de regresión: Y=mx+b Cuanto mas cercanos están los datos a la línea que se obtiene del análisis por mínimos cuadrados, menores son los residuales Gloria María Mejía Z

101 VALIDACION DE METODOS ANALITICOS
Variables transformadas. Transformaciones para linearizar las funciones. Gloria María Mejía Z


Descargar ppt "ESTADÍSTICA EN QUÍMICA ANALÍTICA"

Presentaciones similares


Anuncios Google