Ajustes de datos: manejo de datos ausentes y de rezagados. Capítulo 7 de McCune y Grace 2002
Cotejo de errores de datos Errores ocurren a menudo al pasar datos de hojas de datos a computadora. Casi siempre se encuentran luego de comenzado los análisis. Conviene hacer el cotejo antes de comenzar cualquier ajuste de datos o análisis.
Datos ausentes Decisiones sobre qué hacer con datos ausentes dependerá de la cantidad y el patrón de esos datos.
Según la cantidad de datos ausentes Si muchos: ¿conviene analizar dichos datos? Si pocos: Eliminar variables (e.g., especies) objetos (e.g., unidades de muestra) O sustituir con valores razonables
Según el patrón de datos ausentes Si concentrados en columnas o filas particulares considerar eliminarlas. Si son pocos pero regados por la matriz considerar: Sustituir por conocimiento previo Sustitutuir por promedio o mediana Sustituir por valor esperado según una regresión
Rezagados Rezagados = unidades de muestreo que tienen: valores extremos para especies particulares o combinaciones inusuales de valores para más de una especie
Causas para rezagados Uno o más valores altos Totales de unidad de muestreo bien altos Totales de unidad de muestreo bien bajos Coincidencia de especies raras
Detección de rezagados Criterio general: localizados > 2 desviaciones estándar de distribución de valores o de distribución de distancias
Detección de rezagados
Detección de rezagados Herramientas en Pcord: Outlier analysis: calcula distancias promedio, examina aquellas muestras (o especies) que quedan > cierto # de desviaciones estándar del promedio. Correr ordenación y buscarlos visualmente.
Manejo de rezagados Cotejar datos sean correctos Considerar si realmente pertencen a la población de interés Si no es así, eliminar Si pertenecen, considerar transformar datos.
Ejercicio Busquen rezagados en oakraw_t