La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características.

Presentaciones similares


Presentación del tema: "1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características."— Transcripción de la presentación:

1 1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características de variables estadísticas unidimensionales 1.3.1 Características de posición 1.3.2 Características de dispersión 1.3.3 Características de forma 1.4 Análisis exploratorio de datos: gráfico de caja

2 2 * Estadística descriptiva: parte de la estadística que se ocupa de las etapas 2 y 3  ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de datos, así como del análisis de esta información”  Población: “Conjunto de elementos a los que se les estudia una característica”  Individuo: “Cada uno de los elementos de la población”  Muestra: “Subconjunto representativo de la población”  1.1. Introducción : conceptos básicos  Etapas de un estudio estadístico  Individuo, Población, Muestra 1Recogida de datos 2Ordenación, tabulación y gráficos* 3Descripción de características* 4Análisis formal

3 3  Variable estadística (v.e.): ”Característica propia del individuo objeto del estudio estadístico”  Modalidad: “Cada una de las posibilidades o estados diferentes de una variable estadística”  Exhaustivas e incompatibles  Variables estadísticas. Modalidades Ejemplos: - Estatura - Salario - Color del pelo - Nivel de colesterol - Nº de hijos de una familia Ejemplo: color del pelo: - castaño - rubio - negro

4 4  Cualitativas: Las características no son cuantificables  Cuantitativas: Características cuantificables o numéricas Discretas: Numéricas numerables Continuas: Numéricas no numerables  Tipos de variables estadísticas Ejemplos: Grupo sanguineo Profesión Color del pelo Ejemplos: Nº de hijos de una familia Nº de nidos de procesionarias por árbol Nº de virus en un cultivo Ejemplos: Estatura Salario Nivel de colesterol

5 5 Frecuencias  Absolutas, n i Relativas f i = n i / n Relativas acumuladas F i = N i / n Absolutas acumuladas, N i  Variables discretas xixi nini NiNi fifi FiFi x 1... x i... x k n 1... n i... n k N 1... N i... N k f 1... f i... f k F 1... F i... F k n1  1.2. Tablas estadísticas y representaciones gráficas

6 6  Variables continuas: Intervalos Intervalo I i x ix i n in i NiNi fifi FiFi e 0 – e 1... e i-1 – e i... e k -1 – e k x 1... x i... x k n 1... n i... n k N 1... N i... N k f 1... f i... f k F 1... F i... F k n1  Marca de clase x i (punto medio de cada intervalo)  Amplitud a i (distancia entre los extremos)  Intervalos cerrados por un extremo y abiertos por otro

7 7  V. E. Cualitativas: Gráfico rectangular 20 10 NegroGrisBlancoRojoVioleta  Gráficos estadísticos Color PlumajeNº de Aves ( n i ) Negro10 Gris14 Blanco20 Rojo6 Violeta4 54

8 8  V. E. Cualitativas: Gráfico de sectores rojo violeta negro gris blanco Color Plumaje Nº de Aves n i f if i Grados Negro100,18566,6 Gris140,25993,24 Blanco200,37133,2 Rojo 60,11139,96 Violeta 40,07426,64 54 Grados de un sector = 360 0 x f i

9 9  V. E. Discretas: Gráfico de barras Nº de crías Nº animales: n i f if i FiFi 2200.20 3300.300.50 4250.250.75 5150.150.90 6100.101 n = 100

10 10 Estatura n in i h i = n i / a i 140 – 160 301.5 160 – 170 222.2 170 – 180 202 180 – 190 181.8 190 – 200 101 100  V. E. Continuas: Histograma  El área de cada rectángulo es proporcional a la frecuencia” 1 1,5 1,8 140160170180200 hihi 190 2.2 2

11 11  1.3. Características de variables estadísticas unidimensionales  1.3.1 Características de Posición  Media aritmética EstaturaNº Personas n i M. Clase x i n i x i 140 – 150 201452900 150 – 160 10015515500 160 – 180 8017013600 180 – 200 101901900 n = 21033900

12 12 175 224 453 362 341 nini xixi ♦ Ejemplo  Datos en tabla  Datos en serie 2, 2, 3, 3, 3, 3, 5, 6, 7Mo = 3 Mo = 3  Valor de la variable más frecuente Puede haber más de una moda → Plurimodal  Moda  Variables discretas

13 13 x ix i n in i h i = n i / a i 140 – 160301.5 160 – 170222,2 170 – 180202 180 – 190181,8 190 – 200101 100  Variables continuas ♦ Ejemplo  Observaciones: 1. Puede utilizarse la frecuencia relativa 2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias

14 14  Valor de la variable que ocupa el lugar central en una serie de datos ordenados.  El 50% de los elementos de la población tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la población tienen un valor de la variable mayor o igual que la mediana.  Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 → Me = 6 – 7 Indeterminada entre 6 y 7  Mediana  Variables discretas  Datos en serie xixi nini NiNi fifi FiFi 2330,333 3140,1110,444 5150,1110,555 6160,1110,666 7280,2220,888 8190,1110,999 91 xixi nini NiNi fifi FiFi 3110,1 412 0,2 6350,30,5 7160,10,6 8280,20,8 92100,21 101  Nº impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5

15 15  Datos en tabla  Variables discretas n /2 = 14 F i = 0,5 Me = 2 ♦ Ejemplo 28 4 3 2 1 0 xixi 3 5 10 6 4 nini 1 0.892 0.714 0.357 0.142 FiFi 1 0.107 0.178 0.357 0.214 0.142 fifi 25 20 10 4 NiNi  Observación: Si n / 2 coincide con un N i la mediana está indeterminada entre x i y x i+1

16 16 n/2 = 50 F i = 0,5  Variables continuas ♦ Ejemplo  Observación: Si n/2 coincide con un N i la mediana es el extremo superior del intervalo que le corresponde 1 0.90 0.70 0.45 0.15 FiFi 0.10 0.20 0.25 0.30 0.15 fifi 100 90 70 45 15 NiNi 100 10180 – 200 20170 – 180 25160 – 170 30150 – 160 15140 – 150 nini Estatura

17 17  Definición: P k, k: 1,2,...,99, “percentil k”, valor de la variable que deja por debajo, el k% de los valores de la variable Q 1 = P 25  Cuartil 1º Q 2 = P 50  Cuartil 2º = Me Q 3 = P 75  Cuartil 3º D 1 = P 10  Decil 1º D 2 = P 20  Decil 2º …. D 9 = P 90  Decil 9º  Percentiles  Cálculo para v.e. continuas:  Cálculo para v.e. discretas: Igual que la mediana, cambiando:

18 18 x ix i n in i NiNi 220 33050 44494 520114 610124 Percentil 40, P 40 = 3 Percentil 95, P 95 = 6 n k /100 = 124x25/100 = 31 n k /100 = 124x50/100 = 62 n k /100 = 124x75/100 = 93 ♦ Ejemplos percentiles v.e. discreta Percentil 50, P 50 = 4 = Me = Q 2 Percentil 25, P 25 = 3 = Q 1 Percentil 75, P 75 = 4 = Q 3

19 19 ♦ Ejemplos percentiles v.e. continua Tallas nini NiNi fifi FiFi 140-15015 0.15 150-16030450.300.45 160-17025700.250.70 170-18020900.200.90 180-200101000.101 100

20 20  Q 3 – Q 1  Valor máximo menos valor mínimo de la variable “Miden la Homogeneidad de las observaciones”  1.3.2. Características de Dispersión  Rango o recorrido  Recorrido intercuartílico

21 21  Varianza  Desviación típica  Coeficiente de variación

22 22 xixi nini nixinixi nixi2nixi2 42080320 6402401440 8443522816 10363603600 12222643168 162129611344 ♦ Ejemplo

23 23  Momentos centrales (Respecto a la media)

24 24  1.3.3 Características de forma Distribución sesgada a la derecha ► Distribución simétrica ► Distribución sesgada a la izquierda ►  Coeficiente de Sesgo (Asimetría)

25 25 Distribución más aplastada que la distribución Normal ► Distribución menos aplastada que la distribución Normal ► Distribución igual de aplastada que la distribución Normal ►  Coeficiente de Curtosis (Aplastamiento)

26 26 1.4 Gráfico de caja MeQ3Q3 Q1Q1 f1f1 F1F1 mínf2f2 F2F2 máx f 1 =Q 1 -1.5(Q 3 -Q 1 ) frontera interior inferior f 2 =Q 3 +1.5(Q 3 -Q 1 ) frontera interior superior F 1 =Q 1 -3(Q 3 -Q 1 ) frontera exterior inferior F 2 =Q 3 +3(Q 3 -Q 1 ) frontera exterior superior V.A.I.= Dato más próximo, por exceso, a f 1 (valor adyacente inferior) V.A.S.=Dato más proximo, por defecto, a f 2 (valor adyacente superior) Valores atípicos o anómalos: Datos inferiores a f 1 ó superiores a f 2 (distinguiéndose) * o ** o Me Q3Q3 Q1Q1 v.a.i.anómalosv.a.sanómalos v.a.i. v.a.s.

27 27 Ejemplo Sea la variable estadística “nº de hijos”. Los datos de 30 familias son los siguientes: 1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4 mín = 0 máx = 10 Q 1 = 1 Q 3 = 3 Me = 2 f 1 = -2 f 2 = 6 F 1 = -5 F 2 = 9 Vai = 0 Vas = 5 Valores anómalos = 8, 10 01234 5 678910 * o Datos ordenados: 00000011111111222223333444458 10


Descargar ppt "1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características."

Presentaciones similares


Anuncios Google