Distribución de los datos Representación gráfica de la distribución: Histograma Representa el valor de la frecuencia de aparición de un determinado valor. Sirve para analizar la distribución estadística de los datos. Hace uso de datos estadísticos básicos como la media o la desviación típica. Normalmente, su estudio constituye el primer paso para producir un mapa temático. Uniforme Normal Exponencial Valor Frecuencia
Ejemplo de Histograma
Métodos de Distribución de los datos Intervalos Iguales Cada clase tiene un rango igual de valores. La diferencia entre el mayor y el menor de los valores se divide entre el número de categorías. (Mayor-Menor)/Categorías Fácil de interpretar. Es bueno para las distribuciones uniformes y datos continuos. Inadecuado si los datos están concentrados en unos pocos valores. C1 C2 C3 C4 Frecuencia Menor Mayor Valor
Intervalos Iguales
Métodos de Distribución de los datos Cuartiles Número igual de observaciones para cada categoría. n(C1) = n(C2) = n(C3) = n(C4). Adecuado para datos uniformemente distribuidos. Elementos con valores muy similares pueden acabar en categorías diferentes. Igual Área Las clases se dividen para tener un área similar para cada una de ellas. Es muy similar que los cuartiles si el superficie de cada elementos es similar. n(C1) n(C2) n(C3) n(C4) C1 C2 C3 C4 Frecuencia Valor
Cuartiles
Igual Área
Métodos de Distribución de los datos Desviación Estándar La Media (X) y la desviación estándar (STD) se utilizan para determinar los puntos de corte. Es adecuado cuando la distribución de los datos es normal. Muestra los elementos que están por debajo y por arriba de la media. Se muestran los elementos que son muy diferentes de la media No muestra los valores de los atributos, sólo su distancia respecto del valor promedio. C1 C2 C3 C4 X -1STD +1STD Frecuencia Valor
Desviación Estándar
Métodos de Distribución de los datos Progresión aritmética o geométrica Aumenta la anchura de los intervalos de las clases de una forma no lineal. Es adecuado para las distribuciones exponenciales. C1 C2 C3 C4 Frecuencia Valor
Progresión Geométrica
Métodos de Distribución de los datos Límites naturales Método de optimización complejo. Minimiza la suma de la variación de cada clase. Adecuado para datos que no se distribuyen uniformemente. Difícil de comparar con otras clasificaciones. Difícil de escoger el número idóneo de clases. C1 C2 C3 C4 Frecuencia Valor
Límites Naturales