Ajustes de datos: manejo de datos ausentes y de rezagados.

Slides:



Advertisements
Presentaciones similares
Ajustes de datos: transformación de datos.
Advertisements

Capítulo 4 de McCune y Grace 2002
Análisis de correspondencia canónica (CCA)
Límites y Continuidad.
Determinantes cálculo de determinantes
Gráficos Un gráfico es la representación gráfica de los datos de una hoja de cálculo y facilita su interpretación.
Determinantes cálculo de determinantes
Reducción de dimensionalidad por ordenación Capítulo 13 de McCune y Grace 2002.
Aplicación JAVA implementando Arboles de Decisión
Diagrama de Tallos Y Hojas
Medidas de similaridad y distancia
Representar Datos en una hoja de cálculo Manuel Alejandro López R. Centro Automatización Industrial.
Anuncio Entregar propuesta en o antes de viernes 30 de marzo.
Procedimientos de multirespuesta por permutación (MRPP)
ESTADÍSTICA.. Punto de vista. La palabra estadística tiene diversos significados para diferentes personas. Cuando la mayoría de la gente escucha el termino.
REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.
Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)
VARIABLE ALEATORIA Y DISTRIBUCIÓN NORMAL
Medidas de dispersión. Acción A 10% 25% 9 % 17% 5% Rendimiento anual de dos tipos de acciones en los últimos 5 años Acción B 11% 9% 10% 11% 9% Media de.
VERIFICACIÓN DEL SUPUESTO: DE IGUALDAD DE VARIANZAS: OBSERVACIÓN GRÁFICA Y PRUEBA DE BARTLETT.
Explicando la Desigualdad Socioeconómica en el análisis de Descomposición de la Salud Montevideo, Uruguay Noviembre 2013.
Ing. Leticia de la Torre González ESTADISTICA DESCRIPTIVA.
Establecimiento de los estándares para evaluar los resultados obtenidos, corregir desviaciones, prevenirlas y mejorar las operaciones dela empresa.
PRONOSTICOS CON REGRESION LINEAL MULTIPLE En la regresión lineal simple se investiga la relación entre una variable independiente y otra dependiente. A.
CENTRO DE ESTUDIOS SUPERIORES LA SALLE LICENCIATURA EN EDUACIÓN INVESTIGACIÓN DESCRIPTIVA Mtra. Nancy Zambrano Chávez PRESENTACIÓN CAPÍTULOS 1, 2 y 3 Cristina.
AREA ESTADÍSTICA. ACTIVIDAD 1 En un ensayo de sanidad vegetal se estudia el efecto de una nueva formulación química para el control de una plaga en ajos.
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
Dirección de Marketing ESTRATEGIAS DE PRECIOS
1 Medidas de tendencia central Capítulo dos. 2 Medidas de tendencia central Miden el comportamiento del centro de una distribución de datos Existen tres.
CONCEPTOS Variable, encuesta, variable cuantitativa, variable cualitativa, estadística, media,mediana,moda. Presenta: Eva Stefani Cruz Vázquez.
Taller introducción a los conceptos básicos de Estadística PRIMERA PARTE 2016 Propósito: Introducir algunos conceptos básicos de Estadística por medio.
Presentado por Karina Yuliet Preciado Mosquera Estadística II.
Nathalia Castellanos Gómez Orfidia Ovalle Garzón Psicología 4D
 Multiversidad Latinoamericana Campus Celaya  Introducción a las Ciencias Sociales  Prof. Francisco David Rojas  1er. Semestre.
Estadística inferencial. ¿Qué es? La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población.
Excel Nivel Principiante Objetivo General Al Finalizar El Curso Los Alumnos Podrán Aplicar Las Principales Herramientas De La Planilla De Cálculo Excel.
Cuestiones problemáticas del análisis de regresión  Causalidad  Tamaño de la muestra  Colinealidad  Medición del error Miles, J. & Shevlin, M. (2011).Applying.
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
PREPARACIÓN DE LOS DATOS
United Nations Statistics Division
METODOLOGÍA Y TÉCNICAS DE INVESTIGACIÓN EN CIENCIAS SOCIALES
Unidad 3 Capítulo II Crecimiento poblacional
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
Ajustes de datos: manejo de datos ausentes y de rezagados.
DIAGRAMA DE PARETO. NOTAS __________________________________________ 1.
Análisis y diseño de experimentos
REGRESIÓN LINEAL SIMPLE
INGENIERÍA DE MÉTODOS Iván R. Coronel, PhD 2016.
Katherine V. Carrasquillo UPRH Biol marzo 2011
INTERVALO DE CONFIANZA
NORMAS ISO.
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
CLASIFICACIÓN DE COSTOS
Herramientas para la Mejora Continua.
La Gestión y el Control de Procesos
Curso de estadística aplicada
Aplicaciones Estadísticas a las Finanzas
Instrumentos de evaluacion
ESTADÍSTICA BÁSICA.
Ley de Benford y su aplicabilidad
Estadística Administrativa II
estadistica 2 conceptos
Teorías sobre comunidades de plantas
SEMINARIO – SEMINARIO DE INVESTIGACIÓN EDUCATIVA
SEMINARIO – SEMINARIO DE INVESTIGACIÓN EDUCATIVA
ESTADISTICA DESCRIPTIVA
“Medidas de dispersión”
Estadística Administrativa I
REGRESION LINEAL SIMPLE
Promediación ponderada (“Weighted averaging”)
Transcripción de la presentación:

Ajustes de datos: manejo de datos ausentes y de rezagados. Capítulo 7 de McCune y Grace 2002

Cotejo de errores de datos Errores ocurren a menudo al pasar datos de hojas de datos a computadora. Casi siempre se encuentran luego de comenzado los análisis. Conviene hacer el cotejo antes de comenzar cualquier ajuste de datos o análisis.

Datos ausentes Decisiones sobre qué hacer con datos ausentes dependerá de la cantidad y el patrón de esos datos.

Según la cantidad de datos ausentes Si muchos: ¿conviene analizar dichos datos? Si pocos: Eliminar variables (e.g., especies) objetos (e.g., unidades de muestra) O sustituir con valores razonables

Según el patrón de datos ausentes Si concentrados en columnas o filas particulares considerar eliminarlas. Si son pocos pero regados por la matriz considerar: Sustituir por conocimiento previo Sustitutuir por promedio o mediana Sustituir por valor esperado según una regresión

Rezagados Rezagados = unidades de muestreo que tienen: valores extremos para especies particulares o combinaciones inusuales de valores para más de una especie

Causas para rezagados Uno o más valores altos Totales de unidad de muestreo bien altos Totales de unidad de muestreo bien bajos Coincidencia de especies raras

Detección de rezagados Criterio general: localizados > 2 desviaciones estándar de distribución de valores o de distribución de distancias

Detección de rezagados

Detección de rezagados Herramientas en Pcord: Outlier analysis: calcula distancias promedio, examina aquellas muestras (o especies) que quedan > cierto # de desviaciones estándar del promedio. Correr ordenación y buscarlos visualmente.

Manejo de rezagados Cotejar datos sean correctos Considerar si realmente pertencen a la población de interés Si no es así, eliminar Si pertenecen, considerar transformar datos.

Ejercicio Busquen rezagados en oakraw_t