La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)

Presentaciones similares


Presentación del tema: "Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)"— Transcripción de la presentación:

1 Un criterio para detectar outliers

2 Otro criterio para detectar errores groseros (outliers)

3 CONTRASTES DE NORMALIDAD Un caso específico de ajuste a una distribución teórica es la correspondiente a la distribución normal. Este contraste se realiza para comprobar si se verifica la hipótesis de normalidad necesaria para que el resultado de algunos análisis sea fiable PRUEBA DE KOLMOGOROV-SMIRNOV Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para contrastar la hipótesis de normalidad de la población, el estadístico de prueba es la máxima diferencia: siendo Fn(x) la función de distribución muestral y Fo(x) la función teórica o correspondiente a la población normal especificada en la hipótesis nula. La distribución del estadístico de Kolmogorov-Smirnov es independiente de la distribución poblacional especificada en la hipótesis nula y los valores críticos de este estadístico están tabulados. Si la distribución postulada es la normal y se estiman sus parámetros, los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors.

4

5 Diagrama de dispersión Un diagrama de dispersión muestra la relación entre 2 variables cuantitativas medidas para los mismos individuos Si una de las variables se puede considerar explicativa, es mejor representarla en el eje de las abcisas y a la variable respuesta en el eje de las ordenadas

6 Diagrama de dispersión- Interpretación Observar el aspecto general e intentar identificar su dirección, forma y la fuerza de la relación entre las 2 variables Asociación positiva asociación y negativa Recordemos que las observaciones atípicas se distinguen claramente del aspecto general del gráfico

7 Un diagrama de dispersión muestra la dirección, forma y fuerza de la relación entre 2 variables cuantitativas. En particular, la correlación (r) mide la fuerza y la dirección de la relación lineal entre 2 variables cuantitativas

8 Correlación (r) r positiva indica asociación positiva r negativo indica asociación negativa r toma valores entre -1 y 1. si r=0 la relación lineal es muy débil, pero si es cercano a 1 o -1, los valores se acerca mucho a una recta. Como r usa valores estandarizados no varia cuando cambian las unidades. La correlación r no describe relaciones curvilíneas auqnue éstas sean fuertes. r se ve fuertemente afectada por observaciones atípicas, por lo que debe ser usado con precaución.

9

10 Definición previa… COVARIANZA- es un valor que indica el grado de variación conjunta de 2 variables aleatorias. Sirve para determinar si hay dependencia entre las variables y para calcular coeficiente de correlación o recta de regresión

11

12

13 Ejercicio 15 210 315 420 538 630 735 840 945 1050 1155 1255 1365 1470 1590 1680 1785 1890 1960 2090 Sean la siguiente tabla de datos. Graficar la dispersión Utilizando planilla electrónica calcular la correlación r entre los valores de ambas columnas.

14 Regresión mínimo cuadrática La recta de regresión describe como cambia una variable y a medida que cambia una variable x. Para predecir un valor de y dado uno de x se utiliza una recta de regresión A diferencia de la correlación, la regresión exige que tengamos una variable explicativa y una variable respuesta. La regresión mínimo cuadrática es un método para hallar la recta que resuma la relación entre 2 variables.

15 Recta de regresión mínimo-cuadrática Diferentes personas dibujarían, razonablemente, diferentes rectas. Ninguna recta pasará por todos los puntos, por lo que se intentará que pase por todos ellos tan cerca como sea posible. La recta la utilizaremos para predecir y a partir de x.

16 predicha (distancia) observada La recta de regresión mínimo cuadrática de y en relación a x, es la recta que hace que la suma de los cuadrados de las distancias verticales de los puntos observados a la recta, sea mínima

17 predicha (distancia) observada

18 Con la recta calculada podemos predecir valor observado-valor predicho=error

19 Ejercicio 15 210 315 420 538 630 735 840 945 1050 1155 1255 1365 1470 1590 1680 1785 1890 1960 2090 Sean la siguiente tabla de datos. Encontrar la ecuación de la recta de regresión mínimo cuadrática


Descargar ppt "Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)"

Presentaciones similares


Anuncios Google