Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)

Slides:



Advertisements
Presentaciones similares
Covarianza muestral Sean x1, x2, ..., xn e y1, y2, ..., yn dos muestras aleatorias independientes de observaciones de X e Y respectivamente. La covarianza.
Advertisements

Regresión y correlación
CURSO DE ESTADÍSTICA BÁSICA
Regresión Lineal Simple
Curso de Estadística Básica
9 Regresión Lineal Simple
Distribuciones bidimensionales. Tablas de contingencia
Clases 4 Pruebas de Hipótesis
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
NIVELACIÓN Nº 02 ANÁLISIS DE GRÁFICOS.
Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
Introducción a la Inferencia Estadística
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
DISTRIBUCIONES DE PROBABILIDAD
Regresión Lineal Simple
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
TEMA : ANALISIS DE REGRESION
Bioestadística. U. Málaga.Tema 3: Estadística bivariante 1 Bioestadística Tema 3: Estadística descriptiva bivariante y regresión lineal.
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE
Tipos de Graficas Ruth N Arce. Existen diferentes tipos de graficas que cada una son utilizados por personas y documentos específicos, que pueden ser.
NÚMEROS ALEATORIOS DEPARTAMENTO DE INFORMATICA UNSL-2007.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MÉXICO FACULTAD DE INGENIERÍA COORDINACIÓN DE MATERIAS PROPEDÉUTICAS INGENIERÍA ELECTRÓNICA ASIGNATURA: MÉTODOS NUMÉRICOS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Estadística bivariada Pedro Godoy Gómez. Si Y es otra variable definida sobre la misma población que X, ¿será posible determinar si existe alguna relación.
Experimentos con un solo factor: anÁlIsis de varianza
La estadística descriptiva es la ciencia de analizar y comprar datos por medio de tablas las cuales después se grafican lo que permite realizar una descripción.
JESUS MELENDEZ SUAREZ. ESTADISTICA Recoge ordena y agrupa datos para plasmarlos en graficas o tablas para ser analízalas finalmente ESTADISTICA DESCRIPTIVA:
Prueba de Friedman Vanessa Restrepo Viviana Sanchez Luisa Arroyave
LA ELIPSE Y LA HIPÉRBOLA PROBLEMAS PROPUESTOS UNIDAD 14.
PRONOSTICOS CON REGRESION LINEAL MULTIPLE En la regresión lineal simple se investiga la relación entre una variable independiente y otra dependiente. A.
CAPÍTULO 6 REGRESIÓN NO LINEAL Nazira Calleja Miles, J. & Shevlin, M. (2011). Applying regression & correlation. A guide for students and researchers.
REGRESIÓN Y CORRELACIÓN LINEAL, SERIES DE TIEMPO Msc. Esmelda Aguirre Téllez Master en Administración de Negocios.
C ONCEPTOS BÁSICOS DE I NFERENCIA II 1. Teorema 1. Si X~N(µ, σ) y Y=aX+b donde a y b son constantes, entonces: Teorema 2. Si X1, X2, …, Xn son variables.
Carlos A. Andújar Rojas, Ph.D. 1. Razonamiento estadístico  Es el proceso por el que se utiliza la lógica para tratar de describir, explicar, predecir.
Catalina Canals Cifuentes 02/10/2015 Modelos Logit y Probit Facultad de Ciencias Sociales Departamento de Sociología Estadística III.
LA METODOLOGIA BOX-JENKINS
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
ANÁLISIS DE VARIANZA DE UN FACTOR ANOVA I Dr. en Ed. Carlos Saúl Juárez Lugo Centro Universitario UAEM Ecatepec 2015.
CONCEPTOS Variable, encuesta, variable cuantitativa, variable cualitativa, estadística, media,mediana,moda. Presenta: Eva Stefani Cruz Vázquez.
MSc. Daisy Espallargas Ibarra
DISTRIBUCIONES DE PROBABILIDAD Por Jorge Sánchez.
INFERENCIA EN LOS MODELOS ARIMA ECONOMETRÍA II CAPÍTULO VI D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero.
Presentado por : Diana Marcela Oviedo Pardo Diana Marcela Oviedo Pardo.
Taller introducción a los conceptos básicos de Estadística PRIMERA PARTE 2016 Propósito: Introducir algunos conceptos básicos de Estadística por medio.
Paola arias Estadística II.  Fue descrita en 1908 por William sealy gosset  Es una distribución de probabilidad que se emplea comúnmente cuando tenemos.
UNIVERSIDAD TECNOLOGICA DE AGUASCALIENTES
Métodos Cuantitativos de Análisis de Datos I. Medidas de Variación.
Estadística y Biometría Modelación Estadística Regresión lineal.
PRESENTADO POR : BRIGITTE HERNÁNDEZ PRESENTADO A : ORFIDIA OVALLE GRUPO 3 D.
Facultad de Ciencias Sociales
Estadística Administrativa II
REGRESIÓN LINEAL SIMPLE
PROBABILIDAD Y ESTADISTICA
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
ANALISIS DE REGRESION SIMPLE
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

Un criterio para detectar outliers

Otro criterio para detectar errores groseros (outliers)

CONTRASTES DE NORMALIDAD Un caso específico de ajuste a una distribución teórica es la correspondiente a la distribución normal. Este contraste se realiza para comprobar si se verifica la hipótesis de normalidad necesaria para que el resultado de algunos análisis sea fiable PRUEBA DE KOLMOGOROV-SMIRNOV Cuando la prueba Kolmogorov-Smirnov kolmogorov se aplica para contrastar la hipótesis de normalidad de la población, el estadístico de prueba es la máxima diferencia: siendo Fn(x) la función de distribución muestral y Fo(x) la función teórica o correspondiente a la población normal especificada en la hipótesis nula. La distribución del estadístico de Kolmogorov-Smirnov es independiente de la distribución poblacional especificada en la hipótesis nula y los valores críticos de este estadístico están tabulados. Si la distribución postulada es la normal y se estiman sus parámetros, los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors.

Diagrama de dispersión Un diagrama de dispersión muestra la relación entre 2 variables cuantitativas medidas para los mismos individuos Si una de las variables se puede considerar explicativa, es mejor representarla en el eje de las abcisas y a la variable respuesta en el eje de las ordenadas

Diagrama de dispersión- Interpretación Observar el aspecto general e intentar identificar su dirección, forma y la fuerza de la relación entre las 2 variables Asociación positiva asociación y negativa Recordemos que las observaciones atípicas se distinguen claramente del aspecto general del gráfico

Un diagrama de dispersión muestra la dirección, forma y fuerza de la relación entre 2 variables cuantitativas. En particular, la correlación (r) mide la fuerza y la dirección de la relación lineal entre 2 variables cuantitativas

Correlación (r) r positiva indica asociación positiva r negativo indica asociación negativa r toma valores entre -1 y 1. si r=0 la relación lineal es muy débil, pero si es cercano a 1 o -1, los valores se acerca mucho a una recta. Como r usa valores estandarizados no varia cuando cambian las unidades. La correlación r no describe relaciones curvilíneas auqnue éstas sean fuertes. r se ve fuertemente afectada por observaciones atípicas, por lo que debe ser usado con precaución.

Definición previa… COVARIANZA- es un valor que indica el grado de variación conjunta de 2 variables aleatorias. Sirve para determinar si hay dependencia entre las variables y para calcular coeficiente de correlación o recta de regresión

Ejercicio Sean la siguiente tabla de datos. Graficar la dispersión Utilizando planilla electrónica calcular la correlación r entre los valores de ambas columnas.

Regresión mínimo cuadrática La recta de regresión describe como cambia una variable y a medida que cambia una variable x. Para predecir un valor de y dado uno de x se utiliza una recta de regresión A diferencia de la correlación, la regresión exige que tengamos una variable explicativa y una variable respuesta. La regresión mínimo cuadrática es un método para hallar la recta que resuma la relación entre 2 variables.

Recta de regresión mínimo-cuadrática Diferentes personas dibujarían, razonablemente, diferentes rectas. Ninguna recta pasará por todos los puntos, por lo que se intentará que pase por todos ellos tan cerca como sea posible. La recta la utilizaremos para predecir y a partir de x.

predicha (distancia) observada La recta de regresión mínimo cuadrática de y en relación a x, es la recta que hace que la suma de los cuadrados de las distancias verticales de los puntos observados a la recta, sea mínima

predicha (distancia) observada

Con la recta calculada podemos predecir valor observado-valor predicho=error

Ejercicio Sean la siguiente tabla de datos. Encontrar la ecuación de la recta de regresión mínimo cuadrática