Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porIsaac Lakedem Modificado hace 7 años
1
1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características de variables estadísticas unidimensionales 1.3.1 Características de posición 1.3.2 Características de dispersión 1.3.3 Características de forma 1.4 Análisis exploratorio de datos: gráfico de caja
2
2 * Estadística descriptiva: parte de la estadística que se ocupa de las etapas 2 y 3 ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de datos, así como del análisis de esta información” Población: “Conjunto de elementos a los que se les estudia una característica” Individuo: “Cada uno de los elementos de la población” Muestra: “Subconjunto representativo de la población” 1.1. Introducción : conceptos básicos Etapas de un estudio estadístico Individuo, Población, Muestra 1Recogida de datos 2Ordenación, tabulación y gráficos* 3Descripción de características* 4Análisis formal
3
3 Variable estadística (v.e.): ”Característica propia del individuo objeto del estudio estadístico” Modalidad: “Cada una de las posibilidades o estados diferentes de una variable estadística” Exhaustivas e incompatibles Variables estadísticas. Modalidades Ejemplos: - Estatura - Salario - Color del pelo - Nivel de colesterol - Nº de hijos de una familia Ejemplo: color del pelo: - castaño - rubio - negro
4
4 Cualitativas: Las características no son cuantificables Cuantitativas: Características cuantificables o numéricas Discretas: Numéricas numerables Continuas: Numéricas no numerables Tipos de variables estadísticas Ejemplos: Grupo sanguineo Profesión Color del pelo Ejemplos: Nº de hijos de una familia Nº de nidos de procesionarias por árbol Nº de virus en un cultivo Ejemplos: Estatura Salario Nivel de colesterol
5
5 Frecuencias Absolutas, n i Relativas f i = n i / n Relativas acumuladas F i = N i / n Absolutas acumuladas, N i Variables discretas xixi nini NiNi fifi FiFi x 1... x i... x k n 1... n i... n k N 1... N i... N k f 1... f i... f k F 1... F i... F k n1 1.2. Tablas estadísticas y representaciones gráficas
6
6 Variables continuas: Intervalos Intervalo I i x ix i n in i NiNi fifi FiFi e 0 – e 1... e i-1 – e i... e k -1 – e k x 1... x i... x k n 1... n i... n k N 1... N i... N k f 1... f i... f k F 1... F i... F k n1 Marca de clase x i (punto medio de cada intervalo) Amplitud a i (distancia entre los extremos) Intervalos cerrados por un extremo y abiertos por otro
7
7 V. E. Cualitativas: Gráfico rectangular 20 10 NegroGrisBlancoRojoVioleta Gráficos estadísticos Color PlumajeNº de Aves ( n i ) Negro10 Gris14 Blanco20 Rojo6 Violeta4 54
8
8 V. E. Cualitativas: Gráfico de sectores rojo violeta negro gris blanco Color Plumaje Nº de Aves n i f if i Grados Negro100,18566,6 Gris140,25993,24 Blanco200,37133,2 Rojo 60,11139,96 Violeta 40,07426,64 54 Grados de un sector = 360 0 x f i
9
9 V. E. Discretas: Gráfico de barras Nº de crías Nº animales: n i f if i FiFi 2200.20 3300.300.50 4250.250.75 5150.150.90 6100.101 n = 100
10
10 Estatura n in i h i = n i / a i 140 – 160 301.5 160 – 170 222.2 170 – 180 202 180 – 190 181.8 190 – 200 101 100 V. E. Continuas: Histograma El área de cada rectángulo es proporcional a la frecuencia” 1 1,5 1,8 140160170180200 hihi 190 2.2 2
11
11 1.3. Características de variables estadísticas unidimensionales 1.3.1 Características de Posición Media aritmética EstaturaNº Personas n i M. Clase x i n i x i 140 – 150 201452900 150 – 160 10015515500 160 – 180 8017013600 180 – 200 101901900 n = 21033900
12
12 175 224 453 362 341 nini xixi ♦ Ejemplo Datos en tabla Datos en serie 2, 2, 3, 3, 3, 3, 5, 6, 7Mo = 3 Mo = 3 Valor de la variable más frecuente Puede haber más de una moda → Plurimodal Moda Variables discretas
13
13 x ix i n in i h i = n i / a i 140 – 160301.5 160 – 170222,2 170 – 180202 180 – 190181,8 190 – 200101 100 Variables continuas ♦ Ejemplo Observaciones: 1. Puede utilizarse la frecuencia relativa 2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias
14
14 Valor de la variable que ocupa el lugar central en una serie de datos ordenados. El 50% de los elementos de la población tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la población tienen un valor de la variable mayor o igual que la mediana. Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 → Me = 6 – 7 Indeterminada entre 6 y 7 Mediana Variables discretas Datos en serie xixi nini NiNi fifi FiFi 2330,333 3140,1110,444 5150,1110,555 6160,1110,666 7280,2220,888 8190,1110,999 91 xixi nini NiNi fifi FiFi 3110,1 412 0,2 6350,30,5 7160,10,6 8280,20,8 92100,21 101 Nº impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
15
15 Datos en tabla Variables discretas n /2 = 14 F i = 0,5 Me = 2 ♦ Ejemplo 28 4 3 2 1 0 xixi 3 5 10 6 4 nini 1 0.892 0.714 0.357 0.142 FiFi 1 0.107 0.178 0.357 0.214 0.142 fifi 25 20 10 4 NiNi Observación: Si n / 2 coincide con un N i la mediana está indeterminada entre x i y x i+1
16
16 n/2 = 50 F i = 0,5 Variables continuas ♦ Ejemplo Observación: Si n/2 coincide con un N i la mediana es el extremo superior del intervalo que le corresponde 1 0.90 0.70 0.45 0.15 FiFi 0.10 0.20 0.25 0.30 0.15 fifi 100 90 70 45 15 NiNi 100 10180 – 200 20170 – 180 25160 – 170 30150 – 160 15140 – 150 nini Estatura
17
17 Definición: P k, k: 1,2,...,99, “percentil k”, valor de la variable que deja por debajo, el k% de los valores de la variable Q 1 = P 25 Cuartil 1º Q 2 = P 50 Cuartil 2º = Me Q 3 = P 75 Cuartil 3º D 1 = P 10 Decil 1º D 2 = P 20 Decil 2º …. D 9 = P 90 Decil 9º Percentiles Cálculo para v.e. continuas: Cálculo para v.e. discretas: Igual que la mediana, cambiando:
18
18 x ix i n in i NiNi 220 33050 44494 520114 610124 Percentil 40, P 40 = 3 Percentil 95, P 95 = 6 n k /100 = 124x25/100 = 31 n k /100 = 124x50/100 = 62 n k /100 = 124x75/100 = 93 ♦ Ejemplos percentiles v.e. discreta Percentil 50, P 50 = 4 = Me = Q 2 Percentil 25, P 25 = 3 = Q 1 Percentil 75, P 75 = 4 = Q 3
19
19 ♦ Ejemplos percentiles v.e. continua Tallas nini NiNi fifi FiFi 140-15015 0.15 150-16030450.300.45 160-17025700.250.70 170-18020900.200.90 180-200101000.101 100
20
20 Q 3 – Q 1 Valor máximo menos valor mínimo de la variable “Miden la Homogeneidad de las observaciones” 1.3.2. Características de Dispersión Rango o recorrido Recorrido intercuartílico
21
21 Varianza Desviación típica Coeficiente de variación
22
22 xixi nini nixinixi nixi2nixi2 42080320 6402401440 8443522816 10363603600 12222643168 162129611344 ♦ Ejemplo
23
23 Momentos centrales (Respecto a la media)
24
24 1.3.3 Características de forma Distribución sesgada a la derecha ► Distribución simétrica ► Distribución sesgada a la izquierda ► Coeficiente de Sesgo (Asimetría)
25
25 Distribución más aplastada que la distribución Normal ► Distribución menos aplastada que la distribución Normal ► Distribución igual de aplastada que la distribución Normal ► Coeficiente de Curtosis (Aplastamiento)
26
26 1.4 Gráfico de caja MeQ3Q3 Q1Q1 f1f1 F1F1 mínf2f2 F2F2 máx f 1 =Q 1 -1.5(Q 3 -Q 1 ) frontera interior inferior f 2 =Q 3 +1.5(Q 3 -Q 1 ) frontera interior superior F 1 =Q 1 -3(Q 3 -Q 1 ) frontera exterior inferior F 2 =Q 3 +3(Q 3 -Q 1 ) frontera exterior superior V.A.I.= Dato más próximo, por exceso, a f 1 (valor adyacente inferior) V.A.S.=Dato más proximo, por defecto, a f 2 (valor adyacente superior) Valores atípicos o anómalos: Datos inferiores a f 1 ó superiores a f 2 (distinguiéndose) * o ** o Me Q3Q3 Q1Q1 v.a.i.anómalosv.a.sanómalos v.a.i. v.a.s.
27
27 Ejemplo Sea la variable estadística “nº de hijos”. Los datos de 30 familias son los siguientes: 1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4 mín = 0 máx = 10 Q 1 = 1 Q 3 = 3 Me = 2 f 1 = -2 f 2 = 6 F 1 = -5 F 2 = 9 Vai = 0 Vas = 5 Valores anómalos = 8, 10 01234 5 678910 * o Datos ordenados: 00000011111111222223333444458 10
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.