Descripción y tratamientos de datos multivariantes

Slides:



Advertisements
Presentaciones similares
Análisis exploratorio de datos
Advertisements

Gráficas del MRU.
Gráfico de tallos y hojas Diagrama de cajas
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
MEDIDAS DE FORMA DE LA DISTRIBUCION
TRABAJO DE INVESTIGACION ESTUDIANTE : -DIAZ MAMANI JORDAN PAUL
Medidas de posición y dispersión IV medio
Métodos Cuantitativos de Análisis de Datos I. Puntuaciones Típicas Escalas Derivadas.
ANÁLISIS ESTADÍSTICO de los RESULTADOS DEL AJUSTE
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
ANÁLISIS DE VARIABLES. ANÁLISIS DE VARIABLES. ESTADÍSTICA DESCRIPTIVA EVALUACION Y CALIDAD EDUCATIVA Dr. Juan Carlos Farías Bracamontes.
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
1. Relación estadística: correlación 2. Diagramas de dispersión o nube de puntos 3. Tablas de frecuencia simples o doble entrada 4. Distribuciones marginales.
Sistema de ecuaciones 2x2. Recordemos lo visto en las clases anteriores…
TEMA 3: Estadística Bidimensional. ● Álvaro Fernández Romero y Luis Carlos Fernández herrezuelo.
CORRELACIÓN.  La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
LECCION 3. Los datos estadísticos provienen de la operación de contar o de medir; y también anotando el numero de elementos que corresponden a cada una.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1  Las medidas de dispersión miden la variabilidad de los datos con relación a una medida de tendencia central.  Las medidas descriptivas más comunes.
1 Ejemplo Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados.
Funciones.
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
Material de estudio de Datos y Azar
LÍNEAS DE DIVISIÓN ÁREA DEL GRÁFICO TÍTULO DEL GRÁFICO SERIES DE DATOS.
Pedro Letelier Patricio Contreras
Normatividad relativa a la calidad
MEDIDAS DE FORMA ASIMETRIA Y CURTOSIS..
Diagrama de caja o (boxplot)
Análisis de varianza Paramétricos vs. No Paramétricos
ESTADÍSTICA UNIDIMENSIONAL
Estadística: conceptos básicos y definiciones.
Fuente:
PLANIFICACIÓN ACADÉMICA CBM-3A
ESTADÍSTICA UNIDIMENSIONAL
ASIMETRÍA.
PREDICCIÓN Y ESTIMACIÓN
Estadística Básica Curso de Estadística Básica MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez SESION 3 MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE.
ANALISIS DE DATOS CUANTITATIVOS
REGRESÍON LINEAL SIMPLE
1. DISTRIBUCIONES BIDIMENSIONALES En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables que se representan.
3. COMPONENTES PRINCIPALES  Introducción  Componentes principales  Componentes principales muestrales  Comportamiento asintótico de autovalores y autovectores.
FACULTAD DE CIENCIAS JURÍDICAS (RELACIONES LABORALES)
1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características.
Niveles de Medición de las Variables Javier Andrés Gómez- Díaz, Ps. Mg. Fuente Imágenes: y
Estadística para investigación 1. 2 Estadística Introducción ¿Qué es la estadística? Es una Ciencia que explica y provee de herramientas para trabajar.
Análisis descriptivo A.F.C. Naturaleza de las variables VARIABLES ESCALARES (CUANTITATIVAS) CONTINUAS T°: 36.5°C Utiliza decimales DISCRETAS 1 SUJETO.
ANALISIS DE VARIANZA
UNIVERSIDAD "ALONSO DE OJEDA"
MODELOS DE DEMANDA LICENCIATURA EN ECONOMÍA 4º CURSO Profesora:
GRÁFICAS UNIVARIABLES. 1. Para variables categóricas a.Diagrama de sectores Se toma un círculo y se divide en tantos sectores como categorías tenga nuestra.
Análisis exploratorio de datos
Medidas de Dispersión Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución con respecto de su media.
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Tema 6: Regresión lineal. 1. Introducción. 2. La ecuación de la recta. 3. El criterio de mínimos cuadrados. 4. Representación gráfica. 5. Coeficientes.
Presentación de datos e interpretación de resultados.
Regresión Lineal Simple
ESTADISTICA DESCRIPTIVA
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Correlación de Variables
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
Aplicaciones Aplicaciones Elaboración de un diagrama de caja y bigotes: Análisis rápido de datos Departamento de Estadística, Demografía, Humanidades.
Medidas de variabilidad o dispersión RANGO-DESVIACIÓN ESTÁNDAR- VARIANZA-COEFICIENTE DE VARIACIÓN- RANGO INTERCUARTÍLICO.
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
ESTADÍSTICA DESCRÍPTIVA Y ANÁLISIS DE DATOS
ESTADÍSTICA DESCRIPTIVA Mg. JHON FREDY SABI ROJAS.
Presentación de datos e interpretación de resultados.
Transcripción de la presentación:

Descripción y tratamientos de datos multivariantes

Descripción y tratamientos de datos multivariantes variable nº 4 Dato x84 = 57.00 Persona nº 8

Descripción y tratamientos de datos multivariantes Si tenemos n personas, y a cada persona le medimos p atributos, esto es que tenemos definidas p variables, entonces tendremos np datos, que conformarán la matriz de datos X, como se indica: i = 1, ... , n representa el individuo; j = 1, ... , p representa la variable

Descripción y tratamientos de datos multivariantes Análisis descriptivo preliminar de la variable categoría de ingresos

Descripción y tratamientos de datos multivariantes media varianza p proporción de casados no tiene sentido el cálculo de la media y la varianza

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables “El examen de la distribución de una variable es esencial, pero muchas veces el investigador está interesado en examinar las relaciones entre dos o más variables. El método más popular de análisis de las relaciones bivariantes es el gráfico de dispersión, un gráfico de puntos de datos basados en dos variables. Se presenta una variable en el eje horizontal y la otra en el vertical. Las variables pueden ser valores observados, valores esperados o incluso residuos. Los puntos del gráfico representan los correspondientes valores conjuntos de las variables para cualquier caso dado. El patrón de los puntos representa la relación entre las variables. Cuando los untos se organizan a lo largo de una línea recta, tenemos una relación lineal de correlación. Un conjunto de puntos curvados puede indicar una relación no lineal, que se puede tratar de varias formas... O puede que no existan patrones, sólo un conjunto de puntos aparentemente aleatorios. En este caso, no hay relación.” (c.f. Análisis Multivariante, Hair et al. 1999, p. 35)

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables Correlación bivariada Nota: ya sabemos, si el coeficiente de correlación de Pearson está cerca del valor entonces hay una dependencia lineal

Descripción y tratamientos de datos multivariantes Análisis de relación entre variables

Descripción y tratamientos de datos multivariantes Análisis de la diferencia entre grupos Es importante saber como se distribuyen los valores para cada grupo y si existen diferencias significativas, así como también saber los casos atípicos que resaltan cuando se separan en grupos. El método rápido para resolver ambos problemas es el gráfico boxplot (“caja y bigotes”). Es una caja que consiste en o siguiente: Los límites superior e inferior de la caja marcan los cuartiles superior e inferior en la distribución de los datos. Por lo tanto, la longitud de la caja es la distancia entre el primer y el tercer cuartil, de forma que la caja contiene el 50% de los datos centrales de la caja. La línea dentro de la caja señala la posición de la mediana. Si ésta cae cerca del final de la caja, se indica la presencia de asimetría. Cuanto mayor es la caja, mayor es la extensión de las observaciones. Las líneas que se extienden desde la caja (“bigotes”) representan la distancia entre la mayor y la menor de las observaciones que están a menos de un cuartil de la caja. Los casos atípicos son observaciones que se sitúan entre 1,0 y 1,5 cuartiles fuera de la caja. Estos valores están marcados con una X.

Descripción y tratamientos de datos multivariantes “caja y bigotes” para la variable ingresos familiares según grupos de casados y solteros.