MEDIDAS DE DISPERSIÓN:

Slides:



Advertisements
Presentaciones similares
Las distribuciones binomial y normal.
Advertisements

REGRESION LINEAL SIMPLE
Error Estándar de la Media
ESTADISTICA INFERENCIAL
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Variable Aleatoria Continua. Principales Distribuciones
Estadística: -Correlación y regresión
FRANCISCO JAVIER RODRÍGUEZ
REGRESION & CORRELACION
4ºESO Matemáticas B Colegio Divina Pastora (Toledo)
Regresión y correlación
Curso de Estadística Básica
Medidas de Dispersión Estadística E.S.O.
Estadística descriptiva
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Curso de Estadística Básica
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
Estadística bidimensional
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis de Correlación y de Regresión lineal simple
Facultad: Turismo Y Hotelería
Distribuciones bidimensionales. Tablas de contingencia
Pronósticos, Series de Tiempo y Regresión
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Distribución Normal Distribución Normal
Gerenciamiento Técnico de Proyectos
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 2: Parámetros Estadísticos
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Titular: Agustín Salvia
Estadística bidimensional
Inferencia Estadística
Función Densidad Continua (o distribución de probabilidad continua)
Tratamiento de datos y azar
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
LA ESTADÍSTICA.
ANALISIS ,GRAFICOS Y MEDIDAS ESTADISTICAS
Tema 6: Distribuciones estadísticas
coeficientes de correlación de
Estadísticos Asunto de Estado: Estadísticos. Estadísticos Los parámetros estadísticos nos permiten tener una idea global de la población, compararla con.
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Análisis de los Datos Cuantitativos
ESTADÍSTICA UNIDIMENSIONAL
Aplicaciones Estadísticas a las Finanzas Clase 1
Fundamentos Aplicaciones Prácticas
Variables estadísticas bidimensionales
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Distribuciones de Probabilidad
Unidad 4 Análisis de los Datos.
TEMA 3: Estadística Bidimensional.
La distribución normal
TEMA : ANALISIS DE REGRESION
Probabilidades y Estadísticas. Conceptos trabajados en años anteriores…  Variable Aleatoria: Es toda magnitud cuyos valores se obtienen en mediciones.
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
Aplicaciones Estadísticas a las Finanzas Clase 1
Coeficiente de variación
REGRESIÓN LINEAL SIMPLE
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
DIPLOMADO DE POSTGRADO
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Medidas de tendencia central
Transcripción de la presentación:

MEDIDAS DE DISPERSIÓN:

Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar. Desviación media absoluta o promedio de desviaciones. ( D.M.A)

Definición : Dado un conjunto de observaciones Tales como X1, X2………Xn, la desviación media se define como el promedio aritmético de las respectivas Desviaciones absolutas con respecto a la media. n D.M.A. = ∑ Xi - X i=1 1.- Hallar la desviación media de los siguientes datos: 9, 4,7,5,3.

Varianza: la varianza se denota por la letra S2 ( s al cuadrado) y se define como el cuadrado medio de las desviaciones con respecto a su media aritmética. n 2 2 = ∑ ( Xi – X) s i=1 n 2.- encuentre la varianza del Problema anterior.

obtenga la d. estándar del ejercicio anterior. Desviación estándar: Dado un conjunto de observaciones x1, x2…. Xn, la desviación estandar denotada por “s” se define como la raíz cuadrada de la varianza, esto es : s = s2 n 2 = ∑ ( Xi – X) i=1 n obtenga la d. estándar del ejercicio anterior.

Medidas de variación para datos agrupados: 1.- Si en una tabla de frecuencias x1, x2,… xk corresponden a los puntos medios de las clases y f1, f2,… fk, son las frecuencias respectivas, entonces la D.M.A. se define como:

k D.M .A. = ∑ Xi – X F i i=1 n 2.- Varianza y desviación standar: Si en una tabla de frecuencias los puntos medios de las clases son x1,x2….., xk y las frecuencias

F1, f2…..fk, entonces la varianza se define como: k k 2= n ∑ Xi2Fi – ( ∑ XiFi )2 i =1 i=1 n2 Y la desviación estándar : 2 =

54 56 58 60 65 70 55 57 59 62 66 71 63 67 75 64 69 77 80

Clase Lim.reales Marca clase xi Frec. fi Xi-media Xifi Xi2 xi2fi 1 52.5-57.5 55 8 -7.67 440 3025 24200 2 57.5-62.5 60 9 -2.66 540 3600 32400 3 62.5-67.5 65 6 2.34 390 4225 25350 4 67.5-72.5 70 7.34 280 4900 19600 5 72.5-77.5 75 12.34 150 5625 11250 77.5-82.5 80 17.34 6400 media =62.66 30 1880 119200

Maximo de carga N° CABLES Marca clase xi Xi-media Xifi Xi2 xi2fi La tabla muestra la distribución de la carga máxima en toneladas, que soportan ciertos cables producidos por una compañía . Determinar la D.M.A. , la varianza y desviación estándar de datos agrupados. Maximo de carga N° CABLES Marca clase xi Xi-media Xifi Xi2 xi2fi 9.3-9.7 2 9.5 -3.3666 19 90.25 180.25 9.8-10.2 5 10 -2.8666 50 100 500 10.3-10.7 12 10.5 -2.366 126 110.25 1323 10.8-11.2 17 11 -1.366 187 121 2057 11.3-11.7 14 11.5 -0.866 161 132.25 1851.5 11.8-12.2 6 -0.366 72 144 864 12.3-12.7 3 12.5 0.134 37.5 156.25 468.75 12.8-13.2 1 13 0.634 169

DISTRIBUCIÓN NORMAL Características: 1.- distribución simétrica de las observaciones alrededor de un valor central (µ). 2.- Forma simétrica de campana cóncava, descendente para “x” hasta un menor de la µ y convexa ascendente para “x”mayor que la desviación estándar de la µ.

3.- El valor de la media, la moda, y la mediana coinciden 4.- La distribución esta caracterizada por dos constantes la µ media y la desviación estándar, una curva normal se representa por la expresión N ( µ, Desv.standar). 5.- El área bajo la curva y sobre el eje “x” es igual a la unidad. 6.- Si a ambos lados de µ se levantan perpendiculares a una distancia de , 2 desv. Stad., 3 desv. Stand.

Las áreas bajo la curva y las perpendiculares representan Los porcentajes del área total de la curva conforme a las Expresiones siguientes: Área entre µ ± desv. Stad. = 0.6826 = 68.26% P(µ - Desv. Stad.≤ x ≤ µ+ Desv. Stad.) = 0.6826 Area entre µ ± 2 desv. Stad. = 95.45 95.45% P ( µ - 2 Desv. Stand. ≤ x ≤ µ + 2 desv.stand.) 0.9545 Área entre µ ± 3 desv.stad. = 0.9973

-3 -2 -1 µ 1 2 3 68.26 %

La distribución normal estandar es aquella cuya media µ = 0 y desviación estandar = 1,cualquier Variable distribuida normalmente puede transformarse En una normal estandar mediante la siguiente Expresión. Z = x - µ desviación standar

Dada una distribución normal con µ = 50 y una Desviación estandar = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62. Solución : P( 45≤ X≤ 62) = ?

Hallar el área bajo la curva normal en cada uno de los Siguientes casos y representarlos gráficamente : Entre desv.stand. = 0 y desv. Stand. = 1.2 P(0 ≤ desv.stan. ≤ 1.2) b) Entre desv. Stan. = - 0.68 y desv.stan. = 0 P ( - 0.68 ≤ desv.stan. ≤ 0 ) Entre desv. Stan. = - 0.46 y desv. Stan.= 2.21 Área pedida = ( área entre d.s. = - 0.46 y d.s.= 0) + ( área entre d.s. = 0 y d.s. = 2.21)

d) Entre d.s.= 0.81 y d.s.= 1.94 Área pedida = ( área entre d.s. = 0 y d.s. = 1.94) – ( área entre d.s. = 0 y d.s = 0.81) e) A la izquiera de d.s. = - 0.6 Área pedida = ( área a la izquierda de d.s.= 0) – ( área entre d.s.= - 0.6 y d.s. = 0

F) A la derecha de d.s.= - 1.28 Área pedida = ( área entre d.s.= - 1.28 y d.s.= 0) + (área a la derecha de d.s.= 0)

2.-En un examen final de matemáticas la media es de 72 y la desviación estandar 15 , determinar las referencias tipificadas de los estudiantes que obtuvieron Puntuaciones de: a) 60 , b) 93, c) 72. 3.- Con referencia al problema anterior , hallar las puntuaciones correspondientes a las referencias tipificadas de a) -1 , b) 1.6

4.- Dos estudiantes fueron informados de que habían recibido referencias tipificadas de 0.8 y -0.4,respectivamente en un examen de ingles, si sus Puntuaciones fueron 88 y 64 respectivamente, hallar la Media y la desviación estandar de las puntuaciones del Examen.

5.- La media de los pesos de 500 estudiantes de un colegio es de 151 libras y la des. Stand. Es de 15 lb. suponiendo que los pesos se distribuyen normal- mente. Hallar cuántos estudiantes pesan, a) entre 119.5 y155.5 lb. P( 119.5 ≤ X ≤ 155.5 ) = P ( 119.5 – 151 ≤ X -151 ≤ 155.5 – 151 ) = 15 15 15

= P ( -2.10 ≤ D.S ≤ 0.3) = Proporción de estudiantes pedida = ( área entre d.S = -2.1 y d.s = 0) + (área entre d.s.= 0 y d.s. =0.3) = 0.4821 + 0.1179 = 0.6 Entonces el número de estudiantes es de (500) (0.6) = 300

b) Más de 185.5 lb P ( x ≥ 185.5 ) = P( x - 151 ≥ 185.5 – 151) = P ( d.s. ≥ 2.30) 15 15 Proporción estudiada pedida = ( área de la derecha De d.s. = 2.3 = (área de la derecha de d.s. = 0) – (área entre d.s.=0 y

d.s. = 2.3) = 0.5 – 0.4893 = 0.0107 El número de estudiantes que pesan mas de 185.5 lb. es = (500) ( 0.0107) = 5.35 c) Menos de 127.5 lb d) 128.5 lb. O menos

6.- la población de millas recorridas por camioneros presenta una media de 8500, con una d.s. de 1950. si se toma una muestra de 100 conductores, cuál es la probabilidad de la media sea : Mayor que 8900 Menor que 8000 Entre 8200 y 8700 Entre 8100y 8400 pp-157

Datos bivariados: La regresión y la correlación son las dos herramientas Estadísticas mas poderosas y versátiles que se pueden Utilizar para solucionar problemas. Por ejemplo: si x es estatura y Y su peso para cada Persona pueden registrarse su estatura y su peso Correspondiente. Se denomina variable independiente o variable de entrada A x y variable dependiente o variable de salida a Y.

La variable independiente x se mide o controla para Predecir la variable dependiente. Cuando ambos analisis, de correlación y regresión Sean aplicables al mismo problema se escribiran los Datos graficamente en un diagrama de dispersión. Este diagrama es una grafica en un sistema de ejes De toos los pares ordenados que forman datos Bivariados. La variable independiente x se grafica Sobre el eje horizontal, y la dependiente y aparece En el eje vertical.

Las siguientes medidas fueron registradas durante un curso De educación física e indican el número de sentadillas y Lagartijas realizadas por 10 estudiantes seleccionados Aleatoriamente. (27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43). X = sentadillas, y = lagartijas

Diagramas de dispersión

CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE: La correlación simple estudia la variación Simultanea de dos variables. La correlación entre dos variables es positiva, cuando el aumento de una de ellas va acompañado de un aumento en la otra. Si el aumento de una variable coincide con una disminución en la otra, Se dice que están correlacionadas negativamente.

Si no hay relación entre las dos variables, Se dice que son independientes y que no Están correlacionadas. Ejemplos : temperatura y longitud de una Barra de hierro, estatura y peso de una Persona, edad y presión sanguínea, precoci- Dad y rendimiento.etc….

METODO DE MINIMOS CUADRADOS( utilizando Coeficiente De correlación), la recta de mejor ajuste. El propósito del análisis de la regresión es determinar Una recta de que se ajuste a los datos muéstrales. Utilizando este método se producirá una recta que Pasa por el centro del diagrama de dispersión Aproximándose a los puntos.

Coeficiente de correlación: es un valor que indica el grado de asociación entre dos variables Valores posibles: Si el c.c. = 0 las variables son independientes no hay correlación. b) Si el C.C. = +1 Hay correlación positiva y perfecta c) Si el C.C. = -1 Hay correlación negativa y perfecta d) 0< C.de C. < 1 Y -1< C.de C.< 0

Sugiere cierto grado de asociación. Si la muestra fue Tomada al azar de una población.

Formulas: r = coeficiente de correlación r = ∑ ( X – X) ( Y – Y) = ∑ X Y  (X²) (Y²)  (X²) (Y²) r = coeficiente de correlación ( X – X) = x, desviación de la variable x ( Y – Y) = y, desviación de la variable y X Y = producto de dos desviaciones n = n° de observaciones

x² = x² - (x)² n y² = y² - (y)² xy = xy - (x) (y)

Ejemplo: En un muestreo de personas de diferentes edades Se tomaron datos de la edad “x “ en años y el Promedio de la presión sanguínea “y” en mm de Mercurio , los valores se ilustran en la siguiente tabla.

DATOS EDAD X PRESIÓN Y PRODUCTO (XY) CUADRADOS X² Y² 1 19 122 2 25 125 3 30 126 4 42 129 5 46 130 6 52 135 7 57 138 8 62 142 9 70 145 10 73 146 X = Y= XY= X²= Y²=

XY = ( 65119) - (476) (1338) 10 = 65119 – 63688.8 = 1430.2 X²= 25792 – ( 476)² = 3134.4

Y² = 179700 - (1338)2 10 = 179700 – 179024.4 = 675.6 r = 1430.2 = 0.9828 ( 3134.4) (675.6) indica que existe Una relación positiva entre la edad y presión

Ecuación de predicción: ^ Y = y + b ( x – x) Y = valor teórico ordenado de la línea de regresión. y = promedio de la variable dependiente b = pendiente de la línea de regresión de la muestra o coeficiente de regresión.

X = promedio de la variable independiente X = cualquier valor de la variable independiente. El coeficiente de regresión (b) indica el incremento promedio de Y al aumentar X en una unidad.

b = xy x² Y = y n x = x

x² = x² - (x)² n xy = xy - (x) (y)

b = 1430.2 = 0.45629 3134.4 Y = 133.8 = 133.8 10 X = 476 = 47.6

^ Y = 133.8 + 0.4563 ( X – 47.6) = 133.8 – 21.72 + 0.4563 X = 112.08 + 0.4563 X ¿ si dos personas tienen 45 y 56 años cual será su presión aproximadamente?

Ejercicio : 2 Se recolectaron los datos mensuales por Gastos de publicidad y número de pasajeros Por 15 meses mas recientes los datos apare- en en la table. Desarrolle los cálculos nece- Sarios para obtener el modelo de regresión

Mes Publicidad pasajeros xy x² y² 1 10 15 2 12 17 3 8 13 4 23 5 16 6 21 7 14 20 9 19 24 11 18 Pp 333