Ajustes de datos: manejo de datos ausentes y de rezagados.

Slides:



Advertisements
Presentaciones similares
Presentación de datos e interpretación de resultados
Advertisements

MUESTREO EN INVESTIGACIÓN CUALITATIVA
CONTROL ESTADÍSTICO DE CALIDAD
Pronósticos, Series de Tiempo y Regresión
Medidas de Tendencia Central
Datos, datos y más datos: Funciones
Ajustes de datos: transformación de datos.
Muestreo de comunidades
Datos: Estadística.
Ordenación Polar (Bray Curtis)
Procesamiento estadístico de datos en bioquímica clínica
Métodos de calibración: regresión y correlación
Grupo Continental Control de Procesos.
INDICADORES Elaborado por: Martha B. Luna Alfaro
Escalamiento Multidimensional No-Métrico Capítulo 16 de McCune y Grace 2002.
Capítulo 4 de McCune y Grace 2002
lead conc, ppbsignal, A-s blank tap water sample0.278 Tutorial: Análisis de datos con.
Análisis de correspondencia canónica (CCA)
Análisis de especies indicadoras Capítulo 25 de McCune y Grace 2002.
Límites y Continuidad.
Determinantes cálculo de determinantes
Medidas de similaridad y distancia Capítulo 6 de McCune y Grace 2002, y páginas de Ruokolainen et al
Determinantes cálculo de determinantes
Reducción de dimensionalidad por ordenación Capítulo 13 de McCune y Grace 2002.
Método de mínimos cuadrados
Aplicación JAVA implementando Arboles de Decisión
Diagrama de Tallos Y Hojas
NORMA INTERNACIONAL DE AUDITORÍA 530
REGRESIÓN LINEAL MÚLTIPLE.
Medidas de similaridad y distancia
Anuncio Entregar propuesta en o antes de viernes 30 de marzo.
Procedimientos de multirespuesta por permutación (MRPP)
SESIÓN 14 El análisis de datos en el enfoque cuantitativo.
ESTADÍSTICA.. Punto de vista. La palabra estadística tiene diversos significados para diferentes personas. Cuando la mayoría de la gente escucha el termino.
RECHAZO DE DATOS DE UNA SERIE
ESTADISTICA Llamada ciencia de los datos por el aporte que recibe de la matemática y el uso que hace de esta para la medición de errores. Se encarga de.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Bloque IX - Estadística. Población vs muestra Medidas de dispersión Medidas de tendencia central.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
DISTRIBUCIÓN NORMAL.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
Puntajes estándar y curva normal
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
ESTADÍSTICAS INFERENCIALES
Intervalos de Confianza
PREPARACIÓN DE LOS DATOS
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
RECHAZO DE DATOS DE UNA SERIE Gloria María Mejía Z.
INTERVALOS ES EL RECORRIDO DE TODOS LOS DATOS DENTRO DE UNA CLASE (Li-Ls) CANTIDAD DE CLASES: Raíz cuadrada N AMPLITUD DEL INTERVALO: 1. POR CONVENIENCIA.
Metodología de la Investigación
DISTRIBUCIÓN GAMMA. La distribución gamma se deriva de la función gamma. La distribución gamma tiene un caso especial que es la distribución exponencial.
ANALISIS DE DATOS CUANTITATIVOS
Estadística.
“Formulación de Hipótesis Estadística”
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
UNIVERSIDAD "ALONSO DE OJEDA"
Presentación de datos e interpretación de resultados.
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Ajustes de datos: manejo de datos ausentes y de rezagados.
MUESTREO ALEATORIO Toma de una muestra de tal manera que cualquier miembro de la población tiene una oportunidad igual de ser seleccionado.
Tamaño de muestra.
ESTADÍSTICA DESCRÍPTIVA Y ANÁLISIS DE DATOS
MUESTREO DE ENCUESTAS Y ESTUDIOS. CENSO analizar toda la población Conocer exactamente la distribución de la variable (s) de la población. En muchos casos.
Presentación de datos e interpretación de resultados.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Distribución Normal. La Normal Estándar El modelo normal estándar es el de una variable aleatoria continua cuya imagen son todos los números reales.
Transcripción de la presentación:

Ajustes de datos: manejo de datos ausentes y de rezagados. Capítulo 7 de McCune y Grace 2002

Cotejo de errores de datos Errores ocurren a menudo al pasar datos de hojas de datos a computadora. Casi siempre se encuentran luego de comenzado los análisis. Conviene hacer el cotejo antes de comenzar cualquier ajuste de datos o análisis.

Datos ausentes Decisiones sobre qué hacer con datos ausentes dependerá de la cantidad y el patrón de esos datos.

Decisiones según la cantidad de datos ausentes Si son muchos: ¿conviene analizar dichos datos? Si son pocos: Eliminar variables (e.g., especies) objetos (e.g., unidades de muestra) O sustituir con valores razonables

Decisiones según el patrón de datos ausentes Si concentrados en columnas o filas particulares considerar eliminarlas. Si son pocos pero regados por la matriz considerar: Sustituir por conocimiento previo Sustitutuir por promedio o mediana Sustituir por valor esperado según una regresión

Rezagados Rezagados = unidades de muestreo que tienen… valores extremos para especies particulares o combinaciones inusuales de valores para más de una especie

Causas para unidades de muestreo rezagadas Uno o más valores altos Totales de unidad de muestreo bien altos Totales de unidad de muestreo bien bajos Coincidencia de especies raras

Detección de rezagados Criterio general: localizados > 2 desviaciones estándar de distribución de valores o de distribución de distancias

Detección de rezagados

Detección de rezagados Herramientas en Pcord: Outlier analysis: calcula distancias promedio, examina aquellas muestras (o especies) que quedan > cierto # de desviaciones estándar del promedio. Correr ordenación y buscarlos visualmente.

Manejo de rezagados Cotejar datos sean correctos Considerar si realmente pertencen a la población de interés Si no es así, eliminar Si pertenecen a la poblacion de interes, considerar transformar datos, o considerar analizar con y sin los rezagados para ver su impacto.