ANÁLISIS EXPLORATORIO DE DATOS

Slides:



Advertisements
Presentaciones similares
ANALISIS PARAMÉTRICOS
Advertisements

Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
Regresión mínimo cuadrada (I)
Introducción En toda investigación, y antes de extraer conclusiones acerca de los objetivos e hipótesis planteados, es necesario llevar a cabo un análisis.
ANÁLISIS MULTIVARIADO APLICADO A LA INVESTIGACIÓN DE MERCADOS
Pronósticos, Series de Tiempo y Regresión
ANÁLISIS EXPLORATORIO DE DATOS
ANÁLISIS PREELIMINAR DE LOS DATOS
Bivariadas y Multivariadas
UNIVERSIDAD AUTÓNOMA DEL CARIBE
Análisis exploratorio de datos
FACULTAD DE ECONOMÍA UNAM Maestría en Economía
MODELO DE REGRESIÓN MÚLTIPLE
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
ALGUNOS CONCEPTOS PREVIOS
UNIVERSIDAD NACIONAL DEL SANTA
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
MEDIDAS DE DISPERSIÓN:
Laura López, Marta de Juan, Laura Mallo. Grupo 72. LADE.
ANALISIS EXPLORATORIO
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Mt. Martín Moreyra Navarrete.
Bioestadística Francisco Javier Barón López Dpto. Medicina Preventiva
Curso de Geoestadística 2. Análisis Exploratorio Ramón Giraldo H. PhD Estadística Profesor Departamento de Estadística Universidad Nacional de Colombia.
Representaciones gráficas
TUTORIAL SPSS Análisis descriptivos con el Paquete Estadístico para las Ciencias Sociales Unidad 3.
ANÁLISIS EXPLORATORIO DE DATOS
Laboratorio de Estadística administrativa
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Maestría en Transporte Estadística Capítulo 1. Objetivos ¿Cómo se determinan las magnitudes para planificación de transporte, operación de transporte,
Análisis de regresión MCO MELI.
Herramientas básicas.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
Divisiones de la Estadística
Divisiones de la Estadística
Regresión lineal simple
Diseño de EXPERIMENTOS
Ramón Giraldo H MSc. Estadística. Profesor Universidad Nacional
Titular: Agustín Salvia
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Evaluación de estadística (Caracterización de variables Cuantitativas) Imagínese que usted ha sido contratado por el secretario de salud para elaborar.
DIANA YICELA ALDANA LORENA RAMIREZ YUNDA JHONATAN ANDRES GRACIA
MAYRA ALEJANDRA GRACIA WENDY LIZETH SUAREZ ANGELA MARIA TAMAYO.
Análisis de los Datos Cuantitativos
Titular: Agustín Salvia
Regresión Lineal Simple
REPASO DE ESTADISTICA Supóngase que aplicamos un cuestionario de nueve preguntas a un grupo de 30 alumnos y que sus resultados fueran los siguientes: 4.
¿Qué es la Estadística? Originalmente la palabra estadística ha estado asociada al procesamiento de datos, entendiéndose por esto la representación gráfica,
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Unidad 4 Análisis de los Datos.
CONFIRMATORIO EXPLORATORIO  Enfoque descriptivo  Indica hipótesis  Plan de investigación flexible y poco definido  Privilegia la representación grafica.
REGRESIÓN LINEAL SIMPLE
20. Comparación de promedios entre grupos Módulo IV: Análisis de datos numéricos Análisis de Datos Aplicado a la Investigación Científica
12. Histograma, diagrama de caja y bigotes
Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.
19. Prueba de hipótesis para promedios Módulo IV: Análisis de datos numéricos Análisis de Datos Aplicado a la Investigación Científica
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
UNIVERSIDAD DE COSTA RICA Sistema de Estudios de Posgrado Escuela de Salud Pública I Ciclo lectivo 2003 Epidemiología – (SP – 2216) Profesora: Carmen.
Estadística descriptiva
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS (Universidad del Perú, Decana de América) FACULTAD DE MEDICINA - UPG MAESTRÍA EN NEUROCIENCIAS Curso: Bioestadística.
JAHIR CALDERON RUIZ KATHERINE GUZMAN IPUZ LIZETH YESENIA PATIO.
Transcripción de la presentación:

ANÁLISIS EXPLORATORIO DE DATOS MAYRA ALEJANDRA BAHAMÓN MONTERO JAVIER EDUARDO IBARRA GUTIÉRREZ DIEGO ANDRÉS VILLEGAS BARRIOS

¿QUÉ ES EL ANÁLISIS EXPLORATORIO? Es el conjunto de herramientas estadísticas que permite visualizar el análisis definitivo de los datos de estudio. Donde evalúa la calidad y la consistencia de los datos, resume los datos mediante los gráficos, ayuda a determinar las distribuciones, detecta datos atípicos, comprueba supuestos de Normalidad, linealidad, Homocedasticidad y entre otras.

EL ANALISIS EXPLORATORIO PUEDE SER: UNIVARIANTE BIVARIANTE MULTIVARIANTE Hace referencia al valor de un solo indicador. Relaciona dos o más variables , de manera que se pueda estudiar una variable en función de la otra. (Clasificación cruzada, análisis de varianza y regresiones simples). Aborda todos los indicadores disponible para un fenómeno determinado

ANÁLISIS EXPLORATORIO UNIVARIADO El Análisis Univariante se puede analizar a través de los gráficos de: Histograma. Diagrama de Tallo y hojas. Tallo y hojas. Diagrama de Cajas (Boxplot).

GRÁFICO DE HISTOGRAMA Y CURVA NORMAL Representa la variabilidad debida a causas aleatorias. Se puede apreciar sí hay Simetría o no. Se pueden observar si hay datos atípicos. Ej: En la gráfica se puede observar que hay discrepancia en los datos, encontramos un número menor de intervalo y uno de mayor intervalo. Lo cual no presenta simetría, es decir que la variable “Calidad del producto” presenta valores atípicos.

DIAGRAMA DE TALLO Y HOJAS Nivel de Demanda Stem-and-Leaf Plot Frequency Stem & Leaf ,00 2 . 3,00 2 . 589 7,00 3 . 1222234 17,00 3 . 55666667888899999 16,00 4 . 0001111223333344 22,00 4 . 5566666777777889999999 16,00 5 . 0001133333444444 11,00 5 . 55556788899 7,00 6 . 0000023 1,00 6 . 5 Stem width: 100 Each leaf: 1 case(s) Es un semigráfico que presenta información de las variables cuantitativas. Es una combinación entre el histograma de barras y la tabla de frecuencias. Ej: En el diagrama se observa que la distribución de los datos de la variable “Nivel de Demanda” presenta simetría y Normalidad. Presenta un valor mínimo de 2 y un valor máximo de 6,5.

DIAGRAMA DE CAJA Y BIGOTES (BOXPLOT) Permite analizar, resumir y comparar simultáneamente varios conjuntos de datos. Permite examinar la posible presencia de normalidad, simetría y valores atípicos. Ej: En el diagrama se observa que hay un valor máximo de 8 y un valor mínimo de 2,5. También se aprecia que la distribución es asimétrica, ya que la media tiende ser menor que la mediana, es decir se aproxima al percentil 25.

ANÁLISIS EXPLORATORIO BIVARIADO El análisis bivariado exresa el grado de relación entre dos variables y las diferencias entre grupos de variables. Se pueden analizar a través de los gráficos de cajas y bigotes. Son un complemento del análisis de varianza y del análisis de correlación.

Comprobación de los supuestos del análisis multivariante NORMALIDAD Se comprueba mediante el método gráfico, para apreciar que la media y la volatilidad son cercanas a los valores establecidos. Para contratar la normalidad se utiliza la prueba de: Chi cuadrado, prueba Shapiro & Wilk y prueba Kolmogorov Sminov. HETEROSCEDASTICIDAD Se comprueba mediante el método gráfico, y se analiza los residuos respecto las variables endógenas y exógenas que permita determinar cuál es la variable con mayor heteroscedasticidad. MULTICOLI-NEALIDAD El supuesto de que las variables sean independientes, se analizan mediante las correlaciones. Esto permite determinar si hay multicolinealidad. Sus soluciones son: Ampliar la muestra , realizar transformaciones entre las variables y/o sustituir o suprimir algunas de las variables. AUTOCORRE-LACIÓN Se evalúa mediante el análisis gráfico, si hay una estructura aleatoria de libre de tendencia. El supuesto de que el error es una variable aleatoria con esperanza nula y matriz de covarianza constante es una hiotesis de autocorrelación LINEALIDAD Los gráficos que no son lineales , es decir hay dispersión de las variables y residuos con secuencias no aleatorios. Detecta la falta de Linealidad.

GRÁFICOS DEL ANÁLISIS EXPLORATORIO MULTIVARIADO Dentro de las gráficas del Análisis Exploratorio encontramos la Matrices de Dispersión que representa las relaciones entre las variables .