RECHAZO DE DATOS DE UNA SERIE Gloria María Mejía Z.

Slides:



Advertisements
Presentaciones similares
RECHAZO DE DATOS DE UNA SERIE
Advertisements

Nazira Calleja. Es un índice estadístico que cuantifica la magnitud de la relación entre dos variables o la diferencia entre dos grupos. Indica qué tan.
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
El estadístico Chi- cuadrado ING. RAÚL ALVAREZ GUALE, MPC.
El método científico.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
PRUEBA DE HIPÓTESIS CAROLIN RAMOS GALVÁN. PRUEBA DE HIPOTESIS Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis. Hipótesis.
XVII CONIC 2009 Congreso Nacional de Ingeniería Civil Capítulo de Ingeniería Civil Consejo Departamental De Lambayeque Colegio de Ingenieros del Perú.
ÉSTADÍSTICAS DESCRIPTIVAS ORGANIZACIÓN DE DATOS
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
PSICOESTADÍSTICAS INFERENCIALES
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
Análisis de Mercados Internacionales
Intervalos de Confianza
puede o no ser verdadero, relativo a una o más poblaciones.
Matemáticas 2º Bachillerato CS
DISTRIBUCION DE PROBABILIDAD NORMAL
Errores de Medición Todas las medidas experimentales vienen
ANALISIS UNILATERAL DE LA VARIANZA POR JERARQUIAS DE KRUSKAL- WALLIS
Clase 8: Contraste de Hipótesis
NORMA INTERNACIONAL DE AUDITORÍA 330
estadistica
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
¿Son nuestros resultados suficientemente confiables para dar soporte a nuestra hipótesis? ¿Podemos rechazar la hipótesis nula?
NIAS 320 IMPORTANCIA RELATIVA.
Tema: Distribución t-Student para una muestra Curso: Seminario de Estadística Aplicada a la Investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN.
MUESTREO DE ACEPTACIÓN Control de Calidad UMSA. Objetivos de un muestreo de aceptación Aceptar o rechazar un lote (sentenciar un lote): –No es una herramienta.
“Formulación de Hipótesis Estadística”
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
Capítulo 10 Test de Hipótesis Capítulo 10 Test de Hipótesis.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
 DIFERENTES TIPOS DE MUESTRA  SELECCION DE LA MUESTRA  TAMAÑOS DE LA MUESTRA PRESENTA: RAQUEL AGUILAR DAMIAN METODOLOGIA DE LA INVESTIGACION TEMA 7.
ANALISIS DE VARIANZA
PRECISIÓN y EXACTITUD.
ESTADÍSTICA DESCRIPTIVA
1 DISEÑO DE LA PROPUESTA DE INVESTIGACIÓN.
MUESTREO DE ACEPTACION
Ensayos Interaboratorio. Distintos Tipos y Objetivos
Metodología de la Investigación
Dr. Carlomagno Araya Alpízar
INTRODUCCION A LOS CONTRASTES BASADOS EN RANGOS
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
UNIVERSIDAD DE LOS ANDES CENTRO DE INVESTIGACIONES PSICOLÓGICAS
Presentación de datos e interpretación de resultados.
Intervalos de confianza Muestras pequeñas
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
1 TEMA 2. INTRODUCCION A LA ESTADISTICA DESCRIPTIVA E INFERENCIAL 2.1 DEFINIICION 2.2. AZAR Y PROBABILIDAD 2.3 MUESTREO 2.4 ESTIMACION DE PARAMETROS
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Alumna : Karen Cabana Gil
Distribución Normal de una Variable
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
Tamaño de muestra.
Mg. Homero Ango Aguilar Mg. Jimmy Homero Ango Bedriñana Población, Muestra y Unidad de Análisis Universidad Nacional San Cristóbal de Huamanga Curso de.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
TEORIA de ERRORES. Generalidades:  Una “discrepancia" es la diferencia entre dos valores medidos de la misma cantidad.-  La “precisión” se refiere al.
Medidas de dispersión Por E. Skerrett.
Presentación de datos e interpretación de resultados.
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Prueba de Hipótesis Concepto Asignar Probabilidades de ocurrencia a un evento basado en la suposición (hipótesis) de un evento o distribución.
Transcripción de la presentación:

RECHAZO DE DATOS DE UNA SERIE Gloria María Mejía Z

Cuando se escoge el nivel de significación 0,05 (ó 5%), tenemos un 95% de confianza de que hemos adoptado la decisión correcta y una probabilidad 0,05 de ser falsa. Gloria María Mejía Z

Cómo determina si un valor es realmente un valor atípico y cómo decide si debe continuar o no con el análisis de datos? Uno de los problemas en el análisis de datos es manejar los valores atípicos dentro de un grupo de datos. Un valor atípico es una observación con un valor que no parece corresponderse con el resto de los valores en el grupo de datos. Por lo general surgen dos preguntas: 1)¿Es este valor realmente un valor atípico? 2)¿Puedo eliminar este valor y continuar con el análisis de datos? Gloria María Mejía Z

DATOS ATIPICOS Con respecto a la pregunta 2, debe saberse que las pruebas estadísticas se utilizan para identificar valores atípicos, no para retirarlos del grupo de datos. Técnicamente, una observación no debe retirarse a menos que una investigación halle una causa probable para justificar esta acción Gloria María Mejía Z

DATOS ATIPICOS Si en la investigación no se encuentra una causa probable, ¿qué debe hacerse? Un enfoque sería realizar un análisis de datos con el valor atípico y sin él. Si las conclusiones son diferentes, entonces se considera que el valor atípico tiene influencia y esto debería indicarse en el informe. Otra opción es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal como la mediana de la muestra en lugar de la media. Gloria María Mejía Z

RECHAZO DE DATOS Dos de las pruebas estadísticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atípicos comparados con los valores del grupo de datos. Gloria María Mejía Z

RECHAZO DE DATOS Estas técnicas están diseñadas para detectar un único valor atípico en un grupo de datos, y por lo tanto no son adecuadas para la detección de múltiples valores atípicos. Una técnica rigurosa y amplia para identificar eficazmente múltiples valores atípicos es el procedimiento para muchos valores atípicos con generalización extrema de la desviación de Student. Gloria María Mejía Z

DIXON Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 Ordenando los datos: 3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8 El tamaño de la muestra es 7, y la relación utilizada es el espacio entre el valor atípico (7.8) y su vecino más próximo (5.3) dividido por el espacio entre los valores más grandes y más pequeños en el grupo. Por lo tanto, el índice de Dixon es: (7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = Gloria María Mejía Z

RECHAZO DE DATOS Este valor se compara con un valor crítico de una tabla, y el valor se declara valor atípico si supera ese valor crítico. Si D calculado >D tabulado se rechaza el dato El valor tabulado depende del tamaño de la muestra, n, y de un nivel de confianza elegido, que es el riesgo de rechazar una observación válida. La tabla por lo general utiliza niveles de baja confianza tal como 1% o 5%. Para un n = 7 y un riesgo del 5%, el valor en la tabla es El índice de Dixon excede este valor crítico, indicando que el valor 7.8 es un valor atípico. Gloria María Mejía Z

DIXON La prueba de Dixon se usa en un número pequeño de observaciones (menor a 26) y detecta elementos que se encuentren sesgados o que son extremos. Para aplicar la prueba de Dixon se requiere de un número de observaciones igual o mayor a 10. En el caso que las observaciones sean menores a 10 se utiliza como valor esperado el valor de preparación. Gloria María Mejía Z

GRUBBS La prueba de Grubbs utiliza una estadística de prueba, T, que es la diferencia absoluta entre el valor atípico, X O, y el promedio de la muestra (X) dividida por la desviación estándar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviación estándar de la muestra es = La estadística calculada de la prueba es: Gloria María Mejía Z

GRUBBS Para un n = 7 y un riesgo del 5%, el valor tabulado es y el T Calculado = 1.99 excede este valor crítico, indicando que el valor 7.8 es un valor atípico. Gloria María Mejía Z

TEST DE GRUBB PARA DATOS SOSPECHOSOS Recomendado por las normas ISO G= Valor Sospechoso – X S (Con el valor sospechoso incluido) Si Gcalculada > Gtabulada el valor sospechoso se rechaza Gloria María Mejía Z

TEST Q DE DATOS SOSPECHOSOS Aceptar o rechazar un resultado anómalo Aceptar o rechazar un resultado anómalo (outlier) Normalmente se producen al cometer errores o fallos en la metodología aplicada. Se ordenan los datos en forma creciente y se calcula Q Q = desvío = Diferencia entre el dato sospechosos y su vecino más cercano recorrido Diferencia numérica entre el dato de mayor valor y el de menor valor Si Qcalculada > Qtabulada el dato se rechaza Gloria María Mejía Z

Ejemplo: Al efectuar una serie de réplicas para determinar la concentración del ión sulfato en una muestra de agua para riego se obtuvieron los siguientes resultados. Determinar si la medida 6.0 es un valor rechazable. Medida Valor Se ordenan los datos en orden de valor decreciente 6.0, 5.6, 5.5, 5.2, Se calcula Q Q= ( )/ ( ) = Se compara Q calculado con Q tabulado para 5 medidas y un nivel de confianza del 90. Q tab = <0.64, luego el valor 6.0 no es rechazable Gloria María Mejía Z

CONCLUSIONES La ASTM E178, Práctica para manejar observaciones de valores atípicos, contiene muchos procedimientos estadísticos para realizar pruebas de valores atípicos. En esta norma se proveen otros criterios para valores atípicos únicos, así como pruebas para valores atípicos múltiples, y la norma también da pautas para la elección de la prueba.E178 Una referencia más amplia para la prueba de valores atípicos es el libro Valores atípicos en datos estadísticos, publicado por Wiley. Otra referencia útil y más práctica es el Volumen 16 de la Sociedad Estadounidense de Calidad (ASQ) "Referencias básicas para el control de calidad, técnicas estadísticas" Cómo detectar y manejar valores atípicos", ASQC Quality Press. En la práctica E178 de ASTM se indican otras referencias. Gloria María Mejía Z