Estadística Unidimensional Conceptos básicos.

Slides:



Advertisements
Presentaciones similares
BLOQUE: ESTADÍSTICA Y PROBABILIDAD
Advertisements

REPASANDO…………… ESTADISTICA APLICADA. ¿Qué hemos visto? Tipos de variables Niveles de medición de las variables Tabulación y representación gráfica de.
Introducción a la estadística. ¿Qué es la estadística? La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica.
ESTADÍSTICA DESCRIPTIVA MEDIDAS DE VARIABILIDAD Psic. Gerardo A. Valderrama M.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
TEMA 3: ESTADÍSTICA BIDIMENSIONAL. ÍNDICE: 1.- Relación estadística: correlación. 2.- Diagramas de dispersión o nube de puntos. 3.- Tablas de frecuencia.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
1. Parámetros estadísticos: Medidas de Centralización: Medias, moda y Mediana Medidas de Posición:Cuartiles,Deciles,Centiles Medidas de Dispersión: Rango,
MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS.. MEDIDAS DE DISPERSIÓN Y DATOS AGRUPADOS  ¿Qué son las medidas de dispersión?  Parámetros estadísticos que.
Medidas de centralización:  Media aritmética, mediana y moda para: i) listas de datos ii) datos agrupados en una tabla de frecuencia iii) datos agrupados.
CUANTILES UNIDAD TRABAJEMOS CON MEDIDAS DE POSICIÓN CONTENIDO: MEDIDAS DE POSICIÓN, CUARTILES, DECILES Y PERCENTILES OBJETIVO DE UNIDAD: Aplicar medidas.
DETERMINACION E INTERPRETACION DE LAS MEDIDAS DE TENDENCIA CENTRAL POBLACIONAL Y MUESTRAL. POR: JUDITH MARITZA JUAN CARLOS ANA MARTIN AXEL GILBERTO FÁTIMA.
1.3.1Media aritmética, geométrica y ponderada 1.3.2Mediana 1.3.2Moda Regresar.
Estadística.
 Los datos que a continuación se presentan corresponden al número de llamadas telefónicas que un grupo de personas realiza durante el día. 0, 1, 2, 4,
Medidas de Posición: Cuantiles
Probabilidad y Estadística
Material de estudio de Datos y Azar
ESTADÍSTICA UNIDIMENSIONAL
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS 8° BÁSICO
Ejercicio: Clasificar las siguientes variables en: cuantitativa (continua/discreta) o cualitativa (nominal/ordinal): - n° de alumnos por carrera - sexo.
Profesora: Susana Abraham C.
ESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA UNIDIMENSIONAL
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Tendencia Central
Medidas de posición Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es.
ESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA UNIDIMENSIONAL
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
ESTADÍSTICA UNIDIMENSIONAL
Estadística: conceptos básicos y definiciones.
ESTADÍSTICA UNIDIMENSIONAL
Apuntes de Matemáticas 3º ESO
ESTADÍSTICA UNIDIMENSIONAL
MEDIDAS DE POSICION NO CENTRALES
Apuntes de Matemáticas 3º ESO
estadistica
Estadística.
Estadística Unidimensional Conceptos básicos.
ESTADÍSTICA UNIDIMENSIONAL
ETAPA DE ANÁLISIS E INTERPRETACIÓN DE DATOS: MEDIDAS DE RESUMEN
ANÁLISIS ESTADÍSTICO PROFESOR: PIA VEGA CODOCEO. MEDIA ARITMÉTICA Es la suma de los valores de una variable dividida por, él numero de ellos. La media.
1 TEMA 1 DESCRIPCIÓN DE DATOS: ESTADÍSTICA DESCRIPTIVA 1.1 Introducción: conceptos básicos 1.2 Tablas estadísticas y representaciones gráficas 1.3 Características.
Universidad Peruana de Ciencias Aplicadas Matemática Básica (C.C.) Sesión 13.1 Ciclo
Excel Estadístico Medidas de Dispersión.
Contenidos Medidas de Tendencia Central Medidas de Variabilidad
MEDIANA.
PROBABILIDAD Y ESTADISTICA APLICADA A LOS NEGOCIOS
ESTADÍSTICA.
Apuntes de Matemáticas 3º ESO
BIOESTADÍSTICA Contenido  Medidas de tendencia central para datos no tabulados y tabulados.  Medidas de variabilidad. 1 DOCENTE: DIANNA PAUTA MARTILLO.
Apuntes de Matemáticas 3º ESO
MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES I 1º BTO A
Medidas de tendencia central Cuartiles, Deciles, Percentiles.
PROBABILIDAD Y ESTADÍSTICA ING. KARINA REAL A. NO-3-6 NO-3-7 Presentación de la Información Estadística.
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
ESTADISTICA DESCRIPTIVA
URBINA GUADARRAMA GILBERTO MORENO CONTRERAS TANGANXOAN ZUANGUA
Estadística Descriptiva
Apuntes de Matemáticas 3º ESO
DISTRIBUCIÓN DE FRECUENCIAS Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando.
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Tabla de distribución de frecuencias sin intervalos PARA DATOS NO AGRUPADOS.
CAPITULO 3: MEDIDAS DE VARIABILIDAD Y ASIMETRÍA
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Parámetros y estadísticos  Parámetro: Es una cantidad numérica calculada sobre una población - La altura media de los individuos de un país - La idea.
Estadística.
Medidas de variabilidad o dispersión RANGO-DESVIACIÓN ESTÁNDAR- VARIANZA-COEFICIENTE DE VARIACIÓN- RANGO INTERCUARTÍLICO.
Transcripción de la presentación:

Estadística Unidimensional Conceptos básicos. Cualquier elemento o ente que sea portador de información sobre alguna propiedad en la cual se está interesado se denomina individuo. El conjunto de todos los individuos en los que se desea estudiar alguna propiedad o característica se llama población. Todo subconjunto finito de la población sobre el que se realice el estudio de la propiedad deseada, es una muestra. Al número de individuos de este subconjunto se le llama tamaño de la muestra. Ejemplo 1. Para estudiar la evolución del cáncer de mama en la población femenina de un país, se puede considerar que individuo es cada una de las mujeres residentes en el mismo, población es el conjunto de todas ellas y una muestra se obtiene al observar el 1% del censo.

Clasificación de los datos. Ejemplo 2. En un banco de sangre se experimenta un nuevo sistema para aumentar el período de conservación de la misma. En este caso cada bolsa de sangre es un individuo; la población es el conjunto de todas las bolsas del banco y una muestra se obtiene tomando un cierto número de bolsas para su análisis. Clasificación de los datos. Cuando los datos, es decir los resultados de las observaciones, no son magnitudes medibles numéricamente, sino cualidades o atributos, se dice que se trata de datos cualitativos, mientras que en caso contrario se habla de datos cuantitativos. Ejemplo 3. Se observan las causas de muerte de 16 individuos de una cierta población, agrupándolas en las cuatro siguientes: enfermedades cardiovasculares (EC), cáncer (C), accidentes (A) y otras causas (O), habiéndose obtenido los siguientes datos: EC, EC, A, C, O, A, EC, A, O, C,EC, C, O, C, EC y EC. Como los resultados no son medibles numéricamente, los datos son cualitativos. Ejemplo 4. Las notas obtenidas en Matemáticas en una clase de 4º ESO C han sido: 2, 7, 4, 6, 5, 0, 3, 9, 8, 4, 3, 6, 5 y 8.5. Se trata de datos cuantitativos.

A su vez los datos cuantitativos se denominan continuos si los resultados pueden tomar cualquier valor real dentro de un cierto intervalo, o discretos, si sólo pueden tomar ciertos valores particulares. Ejemplo 5. Del estudio de la estatura de un cierto núcleo de población se han obtenido los siguientes datos: 1.62, 1.78, 1.75, 1.58, 1.83, 1.68 y 1.81metros. Son datos continuos, pues los individuos de una población pueden tener como estatura cualquier número real en un cierto intervalo. Ejemplo 6. Del alumbramiento de un conjunto de ratas se ha observado el número de crías, obteniéndose los siguientes valores numéricos: 5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7 y 3. Por no ser posibles números no naturales, es evidente que se trata de datos cuantitativos discretos. Los datos pueden provenir del estudio de un sólo carácter o propiedad (caso unidimensional) o de varios simultáneamente (caso multidimensional).

Representación de datos: Tablas. Las dos formas más comunes de representar los datos son las tablas y los gráficos. Tablas estadísticas Las tablas estadísticas consisten en masas estructuradas de datos. Para la construcción de tablas de datos cuantitativos pueden tratarse éstos individualmente o agrupándolos en clases Tratamiento individual Para variable discreta, o que siendo continua tengamos pocos datos. Lo vemos con un ejemplo. Ejemplo 11. Las notas de los 20 alumnos de una clase son: 4, 3, 3, 5, 6, 7, 9, 0, 5, 4, 9, 5, 2, 7, 2, 2, 5, 6, 5, 0 Vamos a calcular una tabla:

Frecuencias relativas Variable Frecuencias absolutas Frecuencias relativas estadística xi puntuales ni acumuladas Ni puntuales hi acumuladas Hi 2 3 4 5 7 9 14 17 20 1/10 3/20 1/4 5/20=1/4 7/20 9/20 14/20=7/10 17/20 20/20=1 Las notas de los 20 alumnos de una clase son: 4, 3, 3, 5, 9, 7, 9, 0, 5, 4, 9, 5, 2, 7, 2, 2, 5, 7, 5, 0

Tratamiento por clases Cuando en la población o muestra que estudiamos existen muchos valores diferentes, es conveniente, aún a costa de perder algo de información, dividir el intervalo de variación en una serie de subintervalos que cubran el total; a cada uno de ellos se le llama una clase, a sus extremos, extremos de clase, al punto medio de cada clase, marca de clase y a la diferencia entre sus extremos, amplitud de la clase. Lo vemos con un ejemplo. Ejemplo 12. Se ha pasado un test de 79 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente tabla: intervalos mi f. abs. puntual f. abs. acumulada f. rel. puntual f. rel. acumulado [0, 10) [10, 20) [20. 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80) 5 15 25 35 45 55 65 75 40 60 90 105 85 80 100 175 265 370 455 535 600 1/15 1/10 1/8 3/20 7/40 17/120 2/15 13/120 1/6 7/24 53/120 37/60 91/120 107/120 1

En una Caja de Reclutamiento se toma una muestra de tamaño 30 de los pesos de los mozos correspondientes a un cierto reemplazo, obteniéndose los siguientes datos medidos en kg: 71.9, 63.9, 62.3, 72.5, 78.0, 70.7, 71.4, 60.5, 60.9, 68.2, 88.5, 76.1, 82.1, 63.7, 79.8, 67.5, 50.1, 69.5, 66.1, 47.3, 72.1, 59.8, 93.7, 80.7, 61.2, 64.3, 53.7, 74.7, 96.3, 73.2. Construir una tabla de frecuencias agrupando los datos en clases de la misma amplitud. Solución Si bien no es estrictamente necesario, en general, es conveniente ordenar los datos de menor a mayor. A continuación se presenta la misma muestra ordenada: 47.3, 50.1, 53.7, 59.8, 60.5, 60.9, 61.2, 62.3, 63.7, 63.9, 64.3, 66.1, 67.5, 68.2, 69.5, 70.7, 71.4, 71.9, 72.1, 72.5, 73.2, 74.7, 76.1, 78.0, 79.8, 80.7, 82.1, 88.5, 93.7, 96.3.

clases Marcas de clase frecuencias absolutas de clase acumuladas Como los valores extremos son 47.3 y 96.3, el número de clases aconsejado para estos datos es 6, tomaremos 6 intervalos de amplitud 10, la tabla queda estructurada de la siguiente manera: clases Marcas de clase frecuencias absolutas de clase acumuladas Frecuencias relativas de clase acumuladas 45 -55 55 -65 65 -75 75 -85 85 -95 95 -105 50 60 70 80 90 100 3 8 11 5 2 1 22 27 29 30 0.1 0.266 0.366 0.166 0.066 0.033 0.733 0.900 0.966 30 0.9971

Series cronológicas Se Llaman series cronológicas a unas tablas estadísticas que recogen observaciones hechas a lo largo del tiempo, normalmente a intervalos iguales. Es por tanto una serie estadística en que la variable independiente es el tiempo. El número de médicos colegiados en España en el período de 1984 - 1992: 1984 1985 1986 1987 1988 1989 1990 1991 1992 99730 107503 119890 123543 129897 138967 147978 152943 156748

Calificación Alumnos 2 3 4 5 7 9 la media es 93/20=4,65 Medidas de centralización: media (ya conocida), moda (el valor que se presenta con más frecuencia) y mediana (el valor del individuo que ocuparía el lugar central sí se colocaran ordenados de menor a mayor). Tienen como misión representar con un número a la serie estadística bajo el punto de vista de su posición. Calificación Alumnos 2 3 4 5 7 9 Fórmula de la media: Las notas de los 20 alumnos de una clase son: 4, 3, 3, 5, 6, 7, 9, 0, 5, 4, 9, 5, 2, 7, 2, 2, 5, 6, 5, 0 la media es 93/20=4,65

Calificación Alumnos Acumulados 2 3 4 5 7 9 5moda 14mediana 17 20

Medidas de dispersión: rango o recorrido (diferencia entre los valores extremos), desviación media, varianza, desviación típica. Sirven para medir el grado de alejamiento de los datos respecto de una medida central.(la media) La desviación media se calcula así: La varianza se calcula así: = La desviación típica es la raíz cuadrada de la varianza.

Para el cálculo práctico de muchos parámetros estadísticos se utilizan tablas que facilitan dichos cálculos. Utilizaremos dos tipos de tablas que llamamos Tabla I y Tabla II: TABLA 1 xi ni 2 3 4 5 7 9 6 8 25 21 27 4,65 2,65 1,65 0,65 0,35 2,35 4,35 9,30 7,95 3,30 1,30 1,75 7,05 13,05 21,62 7,02 2,72 0,42 0,12 5,52 18,92 43,24 21,06 5,44 0,84 0,60 16,56 56,76

clases Marcas de clase frecuencias absolutas de clase acumuladas En una Caja de Reclutamiento se toma una muestra de tamaño 30 de los pesos de los mozos correspondientes a un cierto reemplazo, obteniéndose los siguientes datos medidos en kg: 71.9, 63.9, 62.3, 72.5, 78.0, 70.7, 71.4, 60.5, 60.9, 68.2, 88.5, 76.1, 82.1, 63.7, 79.8, 67.5, 50.1, 69.5, 66.1, 47.3, 72.1, 59.8, 93.7, 80.7, 61.2, 64.3, 53.7, 74.7, 96.3, 73.2. clases Marcas de clase frecuencias absolutas de clase acumuladas Frecuencias relativas de clase acumuladas 45 -55 55 -65 65 -75 75 -85 85 -95 95 -105 50 60 70 80 90 100 3 8 11 5 2 1 22 27 29 30 0.1 0.266 0.366 0.166 0.066 0.033 0.733 0.900 0.966

clases ni Marcas de clase 45 -55 55 -65 65 -75 75 -85 85 -95 95 -105 50 60 70 80 90 100 3 8 11 5 2 1 19,3 9,3 0,7 10,7 20,7 30,7 57,9 74,4 7,7 53,5 41,4 372,49 86,49 0,49 114,49 428,49 942,49 X = 69,3kg Dm = 8,86kg σ = 11,81kg2 s = 3,43kg

Los pacientes que acuden a una consulta médica se distribuyen, según la edad, en una tabla: La media, desviación típica, mediana y moda. X(edad) [0, 10) [10, 20) [20,30) [30, 40) [40, 50) [50,60) N (frecuencia) 7 10 30 18 12 3 Moda en [20,30) Mediana en [20,30)

Rango o recorrido de una distribución: Será la diferencia entre el mayor y el menor valor de la variable estadística. Coeficiente de variación: será el cociente entre la desviación típica y la media. Agrupación de datos en torno a la media: En el intervalo se encuentra el 68% de los datos. En el intervalo se encuentra el 95% de los datos. En el intervalo se encuentra el 99% de los datos.

Medidas de posición: Cuartiles: son los tres valores que dividen la serie de datos en 4 partes iguales  Q1 , Q2 y Q3 Q1 deja por debajo el 25% de los datos de la distribución. Q2 deja por debajo el 50% de los datos de la distribución coincide con la mediana. Q3 deja por debajo el 75% de los datos de la distribución. Rango intercuartílico RI = Q3 - Q1 Deciles: son los nueve valores que dividen la serie de datos en 10 partes iguales: D1, D2, D3,…, D9 Percentiles: son los noventa y nueve valores que dividen la serie de datos en 100 partes iguales: P1, P2, P3,…, P99

Cálculo de la mediana 1.- Ordenamos los datos de menor a mayor. 2.- Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. Ej: 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 Si tenemos la tabla estadística con las frecuencias acumuladas coincidirá con el dato correspondiente a la primera frecuencia acumulada que sobrepase N/2. 3.- Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. Ej: 7, 8, 9, 10, 11, 12 Me= (9+10)/2 = 9.5

Si los datos están agrupados (en clases): La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre N/2 . Li es el límite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. fi es la frecuencia de la clase donde se encuentra la mediana. ai es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos.

Ejemplo: Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:  Clase de la mediana: [66, 69) fi Fi [60, 63) 5 [63, 66) 18 23 [66, 69) 42 65 [69, 72) 27 92 [72, 75) 8 100

Para los Cuartiles: En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase.

Para los Percentiles: En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del percentil. ai es la amplitud de la clase.

Para los Deciles: En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase el decil.. ai es la amplitud de la clase.

Si los datos están agrupados (en clases): La moda se encuentra en el intervalo con mayor frecuencia. Este intervalo se llamará la clase modal. Pueden haber dos de los datos con la misma frecuencia, entonces diremos que es un conjunto de datos bimodal, o si son más de dos datos, multimodal. Si queremos estimar el valor de la moda podemos hacer dos cosas, considerar que es la maca de la clase modal, o mediante la formula siguiente de modo más riguroso: Li es el límite inferior de la clase modal. D1=fi-fi-1 es la diferencia de la frecuencia absoluta modal y de la clase premodal. D2=fi-fi+1 es la diferencia de la frecuencia absoluta modal y de la clase premodal. fi es la frecuencia absoluta de la clase modal, es decir, la de mayor frecuencia absoluta. ai es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos.

Ejemplo: Edades f [20,25) 25 [25,30) [30,35) 35 * [35,40] 15 Total 100 * Es la clase modal. ai = 5 D1=35-25=10 D2=35-15=20 Li=30