Descargar la presentación
La descarga está en progreso. Por favor, espere
1
ES TA TATATATA DÍS TI TITITI TI CA CACACA CA
2
La Estadística surge como un conjunto de actividades desarrolladas por el Estado para “censar”, es decir, para conocer el número de habitantes y clasificar la población por edad y condición social. Las primeras referencias nos llevan a China, Egipto y la Grecia Clásica. Ya en Roma se realizan los censos de la práctica totalidad del Imperio y se conservan relaciones detalladas que ordena Carlomagno, así como el “Domesday Book” de Guillermo el Conquistador , en el siglo XI.
3
En los siglos XVII y XVIII se aplica a cuestiones relacionadas con juegos de azar (nacimiento de la teoría de la Probabilidad ) y es a partir del siglo XIX cuando se aplica al tratamiento de problemas sociales. Hoy en día los métodos estadísticos están presentes en la inmensa mayoría de los campos del conocimiento y actividad humanos
4
Inductiva o Inferencial
Ciencia que recoge datos, los analiza , los escribe y los sintetiza, tratando de extraer conclusiones y realizar predicciones. Estadística Estadística Descriptiva Estadística Inductiva o Inferencial Recuento de datos Muestreo Ordenación de datos Conclusiones Tablas Previsiones Gráficos Parámetros
5
PARA REALIZAR UN ESTUDIO ESTADÍSTICO
SOBRE UN CARÁCTER IR DE UNA POBLACIÓN IR ELABORAMOS UNA ENCUESTA IR QUE SE APLICARÁ A UNA MUESTRA IR
6
POBLACIÓN es el conjunto de elementos que poseen una característica en común que se va a estudiar. Pueden ser personas, objetos, áreas geográficas, periodos temporales, etc... INDIVIDUO: es cada uno de los elementos (real o abstracto) que forman la población (como un automóvil o una casa, la temperatura, un voto, o un intervalo de tiempo).
7
MUESTRA Subconjunto de elementos de la población sobre los que se realiza el estudio Población es muy grande (los jóvenes españoles de 16 a 18 años) Se destruye el objeto de estudio (duración de las bombillas de bajo consumo ) Muy costoso Deberá ser representativa de toda la población y atender a su diversidad con criterios proporcionales El nivel de eficacia de la estadística depende de la selección correcta de la muestra.
8
ELABORACIÓN DE UNA ENCUESTA ELABORACIÓN DE GRÁFICOS
De forma fiable Con preguntas claras y concisas Evitando ambigüedades y confusiones Garantía de independencia en las respuestas RECOGIDA DE DATOS Organización de los datos obtenidos Tabulación de los datos en “Tablas de frecuencias” ORDENACIÓN DE DATOS Se representa la información recogida En gráficos claros y directos ELABORACIÓN DE GRÁFICOS Parámetros de centralización Parámetros de posición Parámetros de dispersión CÁLCULO DE PARÁMETROS
9
Es el aspecto, fenómeno, rasgo o cualidad que se va a estudiar en cada uno de los individuos de la población. CARÁCTER CUALITATIVO IR CUANTITATIVO IR
10
CARÁCTER CUALITATIVO O ATRIBUTO
Las respuestas no son números Cada una de las respuestas es una modalidad Programa favorito televisión Parques naturales visitados Comida preferida Último Monumento visitado Estado civil Ejemplos Deporte favorito
11
CARÁCTER CUANTITATIVO O VARIABLE
Las respuestas son números. Cada una de las respuestas es una variable estadística DISCRETA CONTINUA La variable toma (o puede tomar) todos los valores de un intervalo. A veces una variable discreta se considera continua si toma un gran número de valores diferentes de un intervalo muy amplio La variable toma valores aislados Edad de los alumnos de un instituto Número de zapato Perímetro craneal Duración de una pila Temperaturas en el mes de Mayo Edad de los trabajadores de una empresa
12
Y organizamos la información con TABLAS DE FRECUENCIAS GRÁFICOS
Una vez que hemos observado y recogido los datos. Hacemos su recuento IR Resumimos la información de forma adecuada para su posterior estudio Si el carácter es cuantitativo discreto, los “k” valores de la variable, que representaremos por x1 , x2 , x3.....xk se ordenan de menor a mayor Si el carácter es cualitativo, las modalidades se escriben sin importar el orden. Modalidad A Modalidad B Modalidad C… x1 x2 x3 ... xk Y organizamos la información con TABLAS DE FRECUENCIAS FRECUENCIAS GRÁFICOS IR IR IR
13
TÉCNICAS DE RECUENTO Aunque hoy en día, esta tarea la realiza el ordenador, este proceso manualmente se realiza con distintas técnicas Por los tradicionales “Palitos” Formando cuadrados Y para muestras más grandes
14
Estos números se denominan frecuencias
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra, resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. xi fi x1 f1 x2 f2 x3 f3 xk fk Estos números se denominan frecuencias
15
La suma de todas las frecuencias es el tamaño de la muestra: N
Es el número de individuos que presentan una modalidad o un valor. Se representa con la letra fi Frecuencia absoluta Frecuencia absoluta acumulada de xj xi fi Fi x1 f1 F1 Es la suma de las frecuencias absolutas hasta la que ocupa el lugar " j " . Se representa con Fj x2 f2 F2 x3 f3 F3 xk fk Fk Coincide con N La suma de todas las frecuencias es el tamaño de la muestra: N
16
Esto hace que no sea una medida útil para poder comparar.
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra xi fi xi fi 4 10 Al aumentar el tamaño de la muestra aumentará también el valor de la frecuencia absoluta 8 16 6 10 7 14 Esto hace que no sea una medida útil para poder comparar. Por esto es necesario introducir el concepto de frecuencia relativa
17
Es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
La denotaremos por hi Frecuencia relativa Frecuencia relativa acumulada de xj xi fi Fi hi Hi x1 f1 F1 h1=f1/N H1 Es la suma de las frecuencias relativas hasta la que ocupa el lugar " j " . Se representa con Hj x2 f2 F2 h2=f2/N H2 x3 f3 F3 h3=f3/N H3 xk fk Fk hk=fk/N Hk La suma de todas las frecuencias relativas es 1 Vale 1
18
N=25 N=50 xi fi hi pi xi fi hi pi Se denota por pi
La frecuencia relativa es un tanto por uno N=25 N=50 xi fi hi pi Hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o Porcentajes. Resulta de multiplicar la frecuencia relativa por 100. xi fi hi pi 4 0,16 16% 10 0,20 20% 8 0,32 32% 16 0,32 32% 6 0,24 24% 10 0,20 20% 7 0,28 28% 14 0,28 28% Se denota por pi Representa el tanto por ciento de los individuos que presentan dicha modalidad o valor de la variable. El Porcentaje acumulado es la suma de los porcentajes hasta el que ocupa el lugar j. Se representa con el símbolo Pj
19
Las tablas estadísticas,
según el número de observaciones y según el recorrido de la variable, pueden ser de distintos tipos, así tenemos las siguientes tablas estadísticas:
20
CARACTER CUALITATIVO Ejemplo : Clasificación de 30 alumnos según la Comunidad Autónoma en la que han nacido : GALICIA PAÍS VASCO ANDALUCIA 19 CASTILLA-LA MANCHA 7 CATALUÑA COMUNIDAD AUTÓNOMA Nº DE ALUMNOS (fi ) hi pi ANDALUCIA 19 19/30 = 0,6333 63,33 % CASTILLA-LA MANCHA 7 7 /30 = 0,23333 23,33 % CATALUÑA 2 2/ = 0,0666 6,66 % GALICIA 1 1/ = 0,03333 3,33 % PAÍS VASCO TOTAL 30 100 NOTA: En la variable cualitativa no tienen sentido las frecuencias acumuladas
21
CARÁCTER CUANTITATIVO
Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si tenemos una muestra de las edades de 5 personas, no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas. xi Las edades de los 5 miembros de una familia: 5 16 8 45 38 8 16 5 38 45
22
CARÁCTER CUANTITATIVO DISCRETO
Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten. Ejemplo: Número de personas activas que hay en 50 familias con las siguientes respuestas ordenadas en una tabla: 2 1 4 3
23
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla: 2 1 4 3 Personas Activas ( xi ) Número de Familias ( fi ) Fi hi Hi pi Pi 1 16 16/50 = 0,32 0,32 32% 2 20 36 20/50 = 0,4 0,72 40% 72% 3 9 45 9/50 0,18 0,890 18% 90% 4 5 50 5/50 = 0,1 10% 100% Total
24
Cuando el tamaño de la muestra y el recorrido
CARÁCTER CUANTITATIVO DISCRETO TRATADO COMO CONTINUO Cuando el tamaño de la muestra y el recorrido de la variable son grandes o los valores están muy dispersos es necesario agrupar en intervalos los valores de la variable. Por ejemplo si preguntamos la edad de las personas que acuden a un parque a lo largo de una hora, obtenemos los siguientes resultados: 3 2 13 4 1 5 6 7 27 15 21 12 11 26 29 17 La variable estadística tiene un recorrido muy grande: ( de 1 a 29 = 28) Por lo que sí queremos hacer una tabla con estos datos tendremos que tomar intervalos.
25
(se redondea por exceso)
Para determinar la amplitud de los intervalos, primero hay que decidir cuántos intervalos queremos Normalmente se suele trabajar entre 5 y 12 intervalos (se redondea por exceso) Los intervalos serán siempre cerrados por la izquierda y abiertos por la derecha [ Li-1 , Li )
26
Rango de 1 a 29, si lo consideramos de 0 a 30 los intervalos son:
13 4 1 5 6 7 27 15 21 12 11 26 29 17 [0,5) [5,10) [10,15) Rango de 1 a 29, si lo consideramos de 0 a 30 los intervalos son: [15,20) [20,25) [25,30) Intervalos de clase Recuento fi Fi hi Hi pi Pi [0, 5) IIIIIIIIIIIII 13 13/36 = 0,36 0,36 36,11% [5, 10) IIIIIIIIIII 11 24 11/36 = 0,31 0,66 30,55% 66,67% [10, 15) IIIIII 6 30 6/36 = 0,167 0,83 16,67% 83,33% [15, 20) II 2 32 2/36 = 0,05 0,89 5,56% 88,89% [20, 25) I 1 33 1/36 = 0,027 0,9167 2,78% 91,67% [25, 30) III 3 36 3/36 = 0,083 8,33% 100%
27
CARÁCTER CUANTITATIVO CONTINUO
Ejemplo: Se mide el perímetro craneal de 33 alumnos y se obtienen los siguientes datos ( en milímetros): 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 la variable estadística es continua Toma, o puede tomar, muchos valores de un intervalo ( 540 , 571 ) Decidimos agrupar los datos en cinco intervalos (se redondea por exceso) los intervalos son: [540, 547) [547, 554) [554, 561) [561, 568) [568, 575)
28
565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Intervalos de clase Recuento fi Fi hi Hi pi Pi [540, 547 ) IIII 4 4/33 = 0,12 0,12 12,12 % [547, 554) IIIIIII 7 11 7/33 = 0,21 0,33 21,21 % 33,33 % [554, 561) IIIIIIII 8 19 8/33 = 0,24 0,57 24,24 % 57,57 % [561, 568) IIIIIIIII 9 28 9/33 = 0,27 0,84 27,27 % 84,84 % [568, 575) IIIIII 5 33 5/33 = 0,15 0,99 15,15 % 99,99 % TOTAL 99,99%
29
Representaciones Gráficas
Carácter cualitativo y cuantitativo discreto POLÍGONO DE FRECUENCIAS IR DIAGRAMA DE SECTORES DIAGRAMA DE BARRAS Representaciones Gráficas IR IR Se eligen dependiendo del tipo de carácter y dan una visión rápida sobre los datos POLÍGONO DE FRECUENCIAS IR IR HISTOGRAMA Carácter cuantitativo continuo
30
Carácter cualitativo DIAGRAMA DE BARRAS
Ejemplo : Comunidad Autónoma en la que han nacido 30 alumnos : GALICIA PAÍS VASCO ANDALUCIA CASTILLA-LA MANCHA 7 CATALUÑA DIAGRAMA DE BARRAS Cataluña Galicia Andalucía Castilla- La Mancha País Vasco
31
Carácter cuantitativo discreto DIAGRAMA DE BARRAS
Número de personas activas que hay en cada una de 50 familias Personas Activas xi Número de Familias fi 1 16 2 20 3 9 4 5 2 1 4 3 DIAGRAMA DE BARRAS 1 2 3 4
32
POLÍGONO DE FRECUENCIAS
Carácter cualitativo Ejemplo : Comunidad Autónoma en la que han nacido 30 alumnos : GALICIA PAÍS VASCO ANDALUCIA CASTILLA-LA MANCHA 7 CATALUÑA POLÍGONO DE FRECUENCIAS Cataluña Galicia Andalucía Castilla- La Mancha País Vasco
33
Carácter cuantitativo discreto POLÍGONO DE FRECUENCIAS
Número de personas activas que hay en cada una de 50 familias Personas Activas xi Número de Familias fi 1 16 2 20 3 9 4 5 2 1 4 3 POLÍGONO DE FRECUENCIAS 1 2 3 4
34
Carácter cualitativo DIAGRAMA DE SECTORES
Ejemplo : Comunidad Autónoma en la que han nacido 30 alumnos xi fi si Galicia 1 País Vasco 1 Castilla-La Mancha 7 Cataluña 2 Andalucía 19
35
Carácter cuantitativo discreto DIAGRAMA DE SECTORES
Personas Activas xi Número de Familias fi Sector si 1 16 2 20 3 9 4 5 Número de personas activas que hay en cada una de 50 familias 2 1 4 3 DIAGRAMA DE SECTORES
36
Carácter cuantitativo continuo Histograma de frecuencias
Ejemplo: Se mide el perímetro craneal de 33 alumnos y se obtienen los siguientes datos. Que se ordenan en intervalos 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Histograma de frecuencias 540 547 554 561 568 575 Intervalos de clase fi Fi [540, 547 ) 4 [547, 554) 7 11 [554, 561) 8 19 [561, 568) 9 28 [568, 575) 5 33
37
Carácter cuantitativo continuo Histograma de frecuencias acumuladas
Ejemplo: Se mide el perímetro craneal de 33 alumnos y se obtienen los siguientes datos. Que se ordenan en intervalos 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Histograma de frecuencias acumuladas 19 11 4 28 33 540 547 554 561 568 575 Intervalos de clase fi Fi [540, 547 ) 4 [547, 554) 7 11 [554, 561) 8 19 [561, 568) 9 28 [568, 575) 5 33
38
Carácter cuantitativo continuo Polígono de frecuencias
Ejemplo: Se mide el perímetro craneal de 33 alumnos y se obtienen los siguientes datos. Que se ordenan en intervalos 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Polígono de frecuencias 540 547 554 561 568 575 Intervalos de clase fi Fi [540, 547 ) 4 [547, 554) 7 11 [554, 561) 8 19 [561, 568) 9 28 [568, 575) 5 33
39
Carácter cuantitativo continuo Polígono de frecuencias acumuladas
Ejemplo: Se mide el perímetro craneal de 33 alumnos y se obtienen los siguientes datos. Que se ordenan en intervalos 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Polígono de frecuencias acumuladas 19 11 4 28 33 540 547 554 561 568 575 Intervalos de clase fi Fi [540, 547 ) 4 [547, 554) 7 11 [554, 561) 8 19 [561, 568) 9 28 [568, 575) 5 33
40
Otras representaciones
Gráficas PICTOGRAMAS
41
Otras representaciones
Gráficas CARTOGRAMAS
42
Otras representaciones Gráficas Diagrama de tallos y hojas
Las edades de 20 personas son: 36 25 37 24 39 20 45 31 29 23 41 40 33 34 Seleccionamos los TALLOS que, en nuestro caso, son las cifras de las decenas 3 Estas cifras se ordenan 2 2 3 4 4 Hojas Tallos Efectuamos un recuento y vamos “añadiendo” cada HOJA a su tallo 2 5 4 4 9 3 4 3 6 7 9 6 1 1 9 3 4 4 5 1 Tallos Hojas Por último reordenamos las hojas y obtenemos el Diagrama de tallos y hojas 2 3 4 4 4 5 9 3 1 1 3 4 6 6 7 9 9 4 1 5
43
Otras representaciones
Gráficas Diagramas lineales
44
Otras representaciones Pirámides de población
Gráficas Pirámides de población
45
Parámetros estadísticos
En el resto del tema nos ocuparemos exclusivamente de las variable cuantitativas, puesto que con los atributos no se pueden realizar operaciones aritméticas. Como hemos estudiado, las variables estadísticas cuantitativas se clasifican en discretas o continuas, por lo que necesitaremos precisar cómo se calculan los parámetros estadísticos en cada caso. En las variables cuantitativas continuas, dado que la tabulación de los datos se hace mediante intervalos, necesitaremos tomar un valor del intervalo para poder operar Este valor se denomina marca de clase y es el punto medio del intervalo.
46
Parámetros estadísticos
Son valores numéricos que sirven para caracterizar una distribución. Sintetizan la información proporcionada por un conjunto de datos, de manera que se conserve la mayor información posible del conjunto total de los datos y el comportamiento global de la población o muestra en estudio. Existen distintos parámetros según el papel que juegan
47
Parámetros estadísticos
de Centralización o Promedios de Posición de Dispersión Buscan características del centro de la distribución Dividen la distribución en intervalos de forma que cada uno de ellos tenga la misma frecuencia. Según el número de partes en que se divide la distribución , los valores tienen distintos nombres. Proporcionan una idea sobre la separación de los datos MEDIA CUARTILES RANGO RECORRIDO IR IR IR DESVIACIÓN MEDIA QUINTILES MODA IR IR IR VARIANZA DECILES MEDIANA IR IR IR DESVIACIÓN TÍPICA PERCENTILES IR IR COEFICIENTE DE VARIACIÓN IR
48
Media Es el cociente entre la suma de todos los valores de la variable y el número total de valores. Ejemplo : Cálculo de la media de los siguientes números 1, 3, 4, 4, 5, 6, 7, 7, 8, 8, 9
49
Si los datos vienen acompañados de sus frecuencias respectivas
Media Si los datos vienen acompañados de sus frecuencias respectivas Personas Activas ( xi ) Número de Familias ( fi ) x i · f i 1 16 2 20 40 3 9 27 4 5 Total 50 103
50
Perímetro craneal de 33 personas
Media Si la variable es continua se toma como xi las marcas de clase m ci que es la semisuma de los extremos del intervalo Intervalos de clase Marcas de clase mc i fi mc i · f i [540, ) 543,5 4 2174 [547, 554) 550,5 7 3853,5 [554, 561) 557,5 8 4460 [561, 568) 564,5 9 5080,5 [568, 575) 571,5 5 2857,5 TOTAL 33 18425,5 Perímetro craneal de 33 personas 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566
51
Moda Es el valor de la variable que tiene mayor frecuencia. Mo
Si todos los datos se repiten el mismo número de veces No tener moda Una distribución puede Se llama UNIMODAL Tener una moda Se llama BIMODAL Tener dos modas Se llama PLURIMODAL Tener más de dos modas En el caso de valores agrupados en intervalos, la moda está en el intervalo al que corresponde mayor frecuencia, si la amplitud es constante, o mayor densidad de frecuencia si la amplitud no es constante. Este intervalo se llama intervalo modal o clase modal
52
Perímetro craneal de 33 personas
Moda Mo En el intervalo de mayor altura se une el extremo superior izquierdo con el extremo superior izquierdo de la clase posterior De forma gráfica El extremo superior derecho con el extremo superior derecho de la clase anterior La abscisa correspondiente al punto donde se cruzan estas rectas es la moda. 540 547 554 561 568 575 Intervalos de clase fi [540, 547 ) 4 [547, 554) 7 [554, 561) 8 [561, 568) 9 [568, 575) 5 Intervalo modal Perímetro craneal de 33 personas 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 Mo
53
Mediana Es el valor de la variable tal que, una vez ordenados los valores de menor a mayor, el número de datos mayores que él es igual al número de datos menores que él. Ocupa el lugar central de la distribución. Me Su cálculo es el siguiente Número de datos impar La mediana es el valor central una vez ordenados de menor a mayor Caso Discreto simple Ejemplo 1, 3, 4, 4, 5, 6, 7, 7, 8, 8, 9 Me=6 Número de datos par La mediana es la semisuma de los dos valores centrales una vez ordenados de menor a mayor Ejemplo 1, 3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9 Me=
54
Caso discreto con frecuencias
Mediana Me Caso discreto con frecuencias Los datos están en una tabla que se completa con la columna de las frecuencias acumuladas 1 2 Se calcula N/2 Si este valor no coincide con alguna frecuencia absoluta acumulada, se mira la primera frecuencia absoluta acumulada que supere N/2 y la mediana será el valor de la variable correspondiente a esa frecuencia absoluta acumulada 3 Si este valor coincide con alguna frecuencia absoluta acumulada, la mediana será la media entre el valor de la variable correspondiente a esa frecuencia absoluta acumulada y el valor siguiente de la variable 4
55
Me= 2 Mediana Mediana Me Personas Activas xi Número de Familias fi Fi
Caso discreto con frecuencias 1 Los datos están en una tabla que se completa con la columna de las frecuencias acumuladas 2 Se calcula N/2 Si este valor no coincide con alguna frecuencia absoluta acumulada, se mira la primera frecuencia absoluta acumulada que supere N/2 y la mediana será el valor de la variable correspondiente a esa frecuencia absoluta acumulada 3 Si este valor coincide con alguna frecuencia absoluta acumulada, la mediana será la media entre el valor de la variable correspondiente a esa frecuencia absoluta acumulada y el valor siguiente de la variable 4 Personas Activas xi Número de Familias fi Fi 1 16 2 20 36 3 9 45 4 5 50 Total Mediana Número de personas activas que hay en cada una de 50 familias Me= 2 2 1 4 3
56
Perímetro craneal de 33 personas
Mediana Me Caso continuo 1 Se mira N/2 en la columna de las frecuencias acumuladas Si coincide con la frecuencia absoluta acumulada, la mediana será el extremo superior del intervalo correspondiente a esa frecuencia absoluta acumulada 2 3 Si no coincide con una frecuencia absoluta acumulada, se busca la primera que supere a N/2, eso nos dará el intervalo mediano Intervalos de clase fi Fi [540, 547 ) 4 [547, 554) 7 11 [554, 561) 8 19 [561, 568) 9 28 [568, 575) 5 33 TOTAL Intervalo Mediano Perímetro craneal de 33 personas 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566
57
Perímetro craneal de 33 personas
Mediana Me Caso continuo gráficamente Perímetro craneal de 33 personas 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566 1 Se construye el polígono de frecuencias acumuladas 19 11 4 28 33 540 547 554 561 568 575 2 Se busca N/2 en el eje vertical Se traza una paralela a OX hasta el polígono de frecuencias 3 33/2=16,5 Me En el punto de corte se traza una paralela a OY hasta el eje de abscisas 4 5 El punto obtenido es la mediana
58
Qr se calcula igual que la mediana pero sustituyendo N/2 por:
Cuartiles Dividen la distribución en cuatro partes iguales, es decir en cuatro intervalos, cada uno de los cuales contiene el 25% de los datos. Son tres cuartiles Q1 Q2 Q3 Q2 = Me Qr se calcula igual que la mediana pero sustituyendo N/2 por: Se llama intervalo intercuartílico o rango intercuartílico a RQ = Q3 – Q1 , es la amplitud del intervalo que comprende el 50% central de las observaciones
59
Kr se calcula igual que la mediana pero sustituyendo N/2 por:
Quintiles Dividen la distribución en cinco partes iguales, es decir en cinco intervalos, cada uno de los cuales contiene el 20% de los datos. Son cuatro quintiles K1 K2 K3 K4 Kr se calcula igual que la mediana pero sustituyendo N/2 por: Se llama intervalo interquintílico o recorrido interquintílico a Rk = K4 – K1. Es la amplitud de un intervalo que comprende el 60% central de la distribución de frecuencias
60
Dr se calcula igual que la mediana pero sustituyendo N/2 por:
Deciles Dividen la distribución en diez partes iguales, es decir en diez intervalos, cada uno de los cuales contiene el 10% de los datos. Son nueve deciles D1, D2, D3, ..., D9 Dr se calcula igual que la mediana pero sustituyendo N/2 por: Se llama intervalo interdecílico o recorrido interdecílico a RD = D9– D1. Es la amplitud de un intervalo que comprende el 80% central de la distribución de frecuencias
61
Percentiles Dividen la distribución en cien partes iguales, es decir en cien intervalos, cada uno de los cuales contiene el 1% de los datos. Son noventa y nueve percentiles P1, P2, P3, ..., P99 Dr se calcula igual que la mediana pero sustituyendo N/2 por: Se llama recorrido intercentílico a RP = P99– P1. Es la amplitud de un intervalo que comprende el 98% central de los datos
62
Recorrido o rango Es la diferencia entre el mayor y el menor valor de la variable. Es mayor cuanto más dispersos estén los datos R Sólo depende de los valores extremos y puede ocurrir que el rango sea muy grande, aunque la mayoría de los valores estén concentrados.
63
Desviación media Una forma de ver si los datos están muy dispersos es calcular las desviaciones de los valores respecto de la media, tomándolas en valor absoluto para poner todas las diferencias positivas y promediarlas. Si los datos están agrupados en intervalos se toma como xi la marca de clase.
64
Su unidad de medida es el cuadrado de la unidad de
Varianza Es la media aritmética de los cuadrados de las desviaciones respecto de la media. Una varianza alta indica que los datos están muy dispersos Su unidad de medida es el cuadrado de la unidad de medida de la variable. Al estar elevadas al cuadrado las desviaciones, se marca más la dispersión de algunos valores de la muestra respecto de la media.
65
Su unidad de medida es la de la variable.
Desviación Típica Es la raíz cuadrada positiva de la varianza. Puede ser mayor que la media si los datos están muy dispersos Su unidad de medida es la de la variable.
66
Coeficiente de variación de Pearson
Es el cociente entre la desviación típica y la media aritmética. Por sí sólo el dato de la varianza o la desviación típica o el recorrido o la desviación media, no indican si la dispersión es “grande” o “pequeña”; depende de lo que estemos midiendo. Por ello hay que comparar la medida de dispersión con un promedio de los valores de la variable. Cuanto menor sea el coeficiente de variación menor dispersión tiene la distribución, por tanto más representativa es la media. Puede ser mayor que 1 C.V. El coeficiente de variación es independiente de las unidades de medida. Al multiplicarlo por 100 aparece expresado en %
67
Número de personas activas que hay en cada una de 50 familias
Cálculo de parámetros Variable discreta Personas Activas ( xi ) Número de Familias ( fi ) x i · f i x i 2 x i 2 · f i 1 16 2 20 40 3 9 27 81 4 5 80 Total 50 103 217 Número de personas activas que hay en cada una de 50 familias 2 1 4 3
68
Perímetro craneal de 33 personas
Cálculo de parámetros Variable Continua Intervalos de clase m c i fi mc i · f i (m c i ) 2 (m c i ) 2 · fi [540, 547 ) 543,5 4 2174,0 295392,25 ,00 [547, 554) 550,5 7 3853,5 303050,25 ,75 [554, 561) 557,5 8 4460,0 310806,25 ,00 [561, 568) 564,5 9 5080,5 318660,25 ,25 [568, 575) 571,5 5 2857,5 326612,25 ,25 TOTAL 33 ,25 Perímetro craneal de 33 personas 565 540 567 556 554 568 562 549 548 543 559 569 570 555 571 541 551 558 563 547 544 566
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.