Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porcristian gomez Modificado hace 6 años
1
1
2
INTRODUCCIÓN El objetivo del curso es la Introducción a los conceptos fundamentales del Análisis de Datos y de la Probabilidad. ¿Qué es la estadística? Es una poderosa herramienta para generar conocimiento que ha experimentado un gran desarrollo a lo largo del tiempo. ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
3
EJEMPLOS DE SU APLICACIÓN SON: 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población. En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.
4
ETAPAS DE UN ESTUDIO ESTADÍSTICO Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son: 1)Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población. 2)Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación. 3)Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio. 4)Inferencia estadística: consiste en suponer un modelo para la población e interpretación de los datos a la luz del modelo para obtener conclusiones generales. 5)Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población
5
ESQUEMA DE LAS ETAPAS DE UN ESTUDIO ESTADÍSTICO AREA DE INTERES DATOS Tema de Investigación -Antecedentes Previos -Objetivos -Preguntas de Investigación -Posibles Hipótesis -Unidad de Análisis -Población -Variables ORGANIZAR Y RESUMIR ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.) INTERPRETACIÓN INFERENCIA ESTADÍSTICA ¿Población o Muestra? CONCLUSIONES Población Muestra Probabilidad INFORMACIÓN
6
VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. Población: “ Las personas que trabajan en empresas de comunicación ” MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Muestra RESUMEN DE ALGUNOS CONCEPTOS PLANTEADOS EN LA INTRODUCCIÓN
7
Problema de Investigación - Antecedentes Previos - Objetivo - Preguntas de Investigación - Posibles Hipótesis - Unidad de Análisis - Población - Variables Herramientas Estadísticas Respuesta al problema de investigación INFORMACIÓN RESUMEN DE ALGUNOS CONCEPTOS PLANTEADOS EN LA INTRODUCCIÓN
8
Vamos a trabajar en los siguientes problemas de investigación: 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad; y 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características. Definir: Población bajo estudio, unidad de análisis, variables de interés. ACTIVIDAD - CASA
9
9 MUESTRA La muestra se genera a través de algún tipo de muestreo PROBABILISTICO El total de elementos de la población serán N y los de la muestra n - Todas las unidades de la población tienen alguna probabilidad de ser seleccionadas. - Para obtener la muestra se requiere tener identificados los elementos de la población. - Los elementos de la población se identifican a través de un listado de elementos, denominado marco muestral. - Para obtener una muestra se requiere de datos previos acerca de la población. - Una de sus ventajas es que puede medirse el tamaño del error en las predicciones. Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado MUESTRA
10
10 TIPOS DE VARIABLES Variables Cuantitativas Tipos de escala Intervalo o Razón DISCRETA Variables Cualitativas CONTINUA Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc. Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. Escala Intervalo: Tiene un cero arbitrario y al cambiar de unidad de medida cambia la descripción de la variable. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura ORDINAL NOMINAL Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc.
11
Variables - Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal) - Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa discreta) - Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de producción. (cuantitativa continua) - Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal) Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país Datos EJEMPLO
12
12 1. Gráfico de Sectores Circulares (de Torta) TIPOS DE GRÁFICOS
13
13 TIPOS DE GRÁFICOS 2. Gráfico de Barras -Este tipo de gráfico se utiliza generalmente para representar la frecuencia de las categorías de una variable cualitativa. -Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha transformada en categorías. -Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos grupos.
14
14 Histograma - Permite la representación de la frecuencia de una variable Cuantitativa. - El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (Nº, %). - Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra). -El histograma se puede construir desde los datos de la tabla de frecuencia de la variable en estudio. TIPOS DE GRÁFICOS 3. Histograma Nº edad Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Ejemplo En el gráfico se puede observar el número de hijos de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 años.
15
TIPOS DE GRÁFICOS 5. Polígono de Frecuencia edad Nº Distribución de los hijos de trabajadores de la empresa de acuerdo a edad -Esta representación se basa en el Histograma. -Sólo es útil para variables cuantitativas. -El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (Nº, %). -Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase).
16
16 TIPOS DE GRÁFICOS 5. Diagrama de Caja - Permite identificar gráficamente la media, los percentiles 25 y 75, mínimo y máximo de una variable. - Sólo es útil para variables cuantitativas. -El eje x permite identificar la poblacion en estudio. - El eje y representa los valores de la variable en estudio. Edad de las personas que se realizaron angioplastía entre 1980 y 2000
17
17 TIPOS DE GRÁFICOS 6. Otros
18
18 OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.. * Al igual que las tablas, los gráficos deben ser auto-explicativos. TIPOS DE GRÁFICOS
19
OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia. * Al igual que las tablas, los gráficos deben ser auto-explicativos. Variables Cuantitativas NOTACION
20
MEDIDAS DE TENDENCIA CENTRAL -Media Aritmética (Promedio) -Mediana -Moda Media Aritmética o Promedio Mediana Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor Si n es par Si n es impar Moda Datos Cualitativos y Cuantitativos VIDEO
21
21 Percentiles, Deciles o Cuartiles -Percentil (ejemplo: 25, 50, 75) -Decil (ejemplo: 4, 5, 8) -Cualtil (ejemplo: 1, 2, 3) El Decil va de 1 a 10 El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos están ordenados de Menor a Mayor Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 El Percentil va de 1 a 100 El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. El Cuartil va de 1 a 4 El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.
22
22 MEDIDAS DE DISPERSIÓN -Rango -Varianza -Desviación Estándar Rango Varianza Datos Cuantitativos Coeficiente de Variación Comparación entre Variables Se refiere al comportamiento de las variables cuantitativas en un grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta mayor variación? Desviación Estándar Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
23
23 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Otras medidas o Coeficientes -Asimetría -Kurtosis o Apuntamiento Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis. Coeficiente de Asimetría Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha Coeficiente de Apuntamiento - Si CAp=3 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>3, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<3 la distribución es más plana y se llama platicúrtica.
24
24 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Otras medidas o Coeficientes -Asimetría -Kurtosis o Apuntamiento Ejemplos
25
25 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Otras medidas o Coeficientes -Asimetría -Kurtosis o Apuntamiento Ejemplos Media3,9 Error típico0,30 Mediana4 Moda4 Desviación estándar1,67 Varianza de la muestra2,78 kurtosis-0,43 Coeficiente de asimetría-0,02 Rango6 Mínimo1 Máximo7 Cuenta30 144 144 145 245 246 246 246 346 347 447 Datos Histograma Medidas descriptivas
26
26 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Rango Intercuatilico (RI): es la diferencia entre el tercer y el primer cuartil RI=C 3 -C 1 Del ejemplo anterior se tiene que Q 1 =C 1 =3 y Q 3 =C 3 =5 por lo tanto RI= 5-3=2 Comparación de la Media y la Mediana: Robustez Los datos atípicos son datos extremos o lejanos de la mayoría de las observaciones. La media y la mediana tienen un comportamiento diferente frente a los datos atípicos La media en su calculo considera todos los datos, incluyendo los datos atípicos. La mediana es una medida que se ve poco afectada por los datos atípicos, no los considera en su calculo dado que separa los datos. Sobre la base de lo anterior, la mediana es una medida robusta en comparación con la media.
27
27 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) f1f1 f2f2 fkfk n1n1 n2n2 nknk Tabla de frecuencia (para variable cuantitativa) 1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma: Sea c j la marca de clase (o centro de clase) y f j la frecuencia relativa de la clase j, donde j=1, 2,…, k. La Desviación típica para datos agrupados esta dada por: 2) La Desviación típica para datos agrupados esta dada por: El Coeficiente de Asimetría para datos agrupados esta dado por: 3) El Coeficiente de Asimetría para datos agrupados esta dado por: El Coeficiente de apuntamiento para datos agrupados esta dada por: 4) El Coeficiente de apuntamiento para datos agrupados esta dada por:
28
28 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) f1f1 f2f2 fkfk n1n1 n2n2 nknk Tabla de frecuencia (para variable cuantitativa) 5) La Mediana para datos agrupados es igual a la clase o intervalo que concentra al menos el 50% de los datos. Para esto se observan las frecuencias relativas acumuladas Sea c j la marca de clase (o centro de clase), f j la frecuencia relativa de la clase j, donde j=1, 2,…, k. Sea Fa j la frecuencia absoluta acumulada de la clase j y fa j la frecuencia relativa acumulada de la clase j, donde j=1, 2,…, k. fa 1 fa 2 FA 1 FA 2 6) El cuartil 1 (Q 1 o C 1 ) para datos agrupados es igual a la clase o intervalo que concentra al menos el 25% de los datos. Observar las frecuencias relativas acumuladas. 6) El cuartil 3 (Q 3 o C 3 ) para datos agrupados es igual a la clase o intervalo que concentra al menos el 75% de los datos. Observar las frecuencias relativas acumuladas. Se pueden obtener percentiles y deciles
29
29 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Tabla 1 Actividad TransporteEstudiaPensionadoTrabaja Autobus570 Bicicleta332 Caminar252 Coche545 Metro674 TransporteNº% Autobus12 20,0 Bicicleta8 13,3 Caminar9 15,0 Coche14 23,3 Metro17 28,3 TOTAL60 100 Actividad Nº% Estudia21 35,0 Pensionado26 43,3 Trabaja13 21,7 TOTAL60 100 Problema Interesa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial. Para esto se consultó a cada persona sobre la actividad a la que se dedicaba y el medio de transporte preferido.
30
30 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60) Tabla 2 Actividad TransporteEstudiaPensionadoTrabajaTOTAL Autobus57012 Bicicleta3328 Caminar2529 Coche54514 Metro67417 TOTAL21261360
31
31 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Transporte Tabla 3 Actividad TransporteEstudiaPensionadoTrabajaTOTAL Autobus57012 %41,758,30100 Bicicleta3328 %37,5 25100 Caminar2529 %22,255,622,2100 Coche54514 %35,728,635,7100 Metro67417 %35,341,223,5100 TOTAL21261360 %3543,321,7100
32
32 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Actividad Tabla 4 Actividad TransporteEstudiaPensionadoTrabajaTOTAL Autobus57012 %23,826,9020 Bicicleta3328 %14,311,515,413,3 Caminar2529 %9,519,215,415 Coche54514 %23,815,438,523,3 Metro67417 %28,626,930,828,3 TOTAL21261360 %100
33
33 Resumen: análisis de frecuencia de 2 variables cualitativas Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutas F ij, donde i=1, 2,…, m y j=1, 2,…, k. Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutas F ij, donde i=1, 2,…, m y j=1, 2,…, k. La frecuencia relativa conjunta se obtiene dividiendo cada F ij por n y se escribe f ij. La frecuencia relativa conjunta se obtiene dividiendo cada F ij por n y se escribe f ij. La distribución marginal de la 1ª variable se obtiene calculando La distribución marginal de la 1ª variable se obtiene calculando i=1,2,…,m i=1,2,…,m La distribución marginal de la 2ª variable se obtiene calculando La distribución marginal de la 2ª variable se obtiene calculando j=1,2,…,k j=1,2,…,k La distribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable.La distribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
34
34 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Distribución conjunta Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. Nº piezas Nº máquinas 011 116 2 320 441 Total104 Nº fallas Nº maquinas 116 243 345 Total104 Nº fallos Nº piezas123Total 045211 128616 2394 3261220 45152141 Total164345104 Calcular lo siguiente 1)Distribución relativa conjunta 2)Distribución del número de fallos condicionada a 3 piezas. 3)La media del numero de fallos 4)La media del numero de piezas 5)La media del numero de fallos condicionada a las 2 piezas
35
35 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Distribución relativa conjunta Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. Calcular lo siguiente 1)Distribución relativa conjunta 2)Distribución del número de fallos condicionada a 3 piezas. 3)La media del numero de fallos 4)La media del numero de piezas 5)La media del numero de fallos condicionada a las 2 piezas x yNº fallos Nº piezas123Total 00,0380,0480,0190,106 10,0190,0770,0580,154 20,0290,0870,0380,154 30,0190,0580,1150,192 40,0480,1440,2020,394 Total0,1540,4130,4331 distribución del numero de fallas condicionada a 3 piezas Nº fallos Nº piezas123Total x=30,10,30,61 la media de fallos condicionada a 3 piezas es:2,50 Nº piezas123Total x=20,18750,56250,251 la media de fallos condicionada a 2 piezas es:2,06 Media de fallos=2,28 Media Nº de piezas=2,62 Solución Cov(x,y)= (0. 1. 0,038+ 0. 2. 0,048+…+ 4. 3. 0,202)- 2,62. 2,28 =6,19-5,96 = 0,23
36
36 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Distribución conjunta Si se tienen 2 variables cuantitativas discretas que se miden a un conjunto de unidades se puede construir: 1)Tablas de doble entrada de frecuencias a absolutas y de frecuencias relativas. 2)Distribución marginal de cada variable. 3)Distribución de una variable condicionada a una categoría de la otra. Medidas que se pueden calcular Frecuencia Absolutas Frecuencia Relativas Media o promedio de x y de y Desviación típica de x y de y Covarianza de x con y Correlación de x con y
37
37 Ejemplo 1 Sobre los datos que se tienen para el curso Aplicar todo lo visto hasta ahora sobre estadística descriptiva, no olvide identificar el problema, la unidad de análisis, las variables en estudio (definición de cada una de ellas donde se identifique la unidad de medida para las variables cuantitativas y las categorías de las variables cualitativas). Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
38
38 MEDIDAS DE ASOCIACIÓN LINEAL - Covarianza - Correlación DatosCuantitativos Covarianza: Recordemos que: Hasta ahora hemos estudiado las medidas tendencia central (Media, Mediana, Moda) y dispersión (Varianza y Desviación Estándar) para una Variable Cuantitativa (x). Es una medida de Variabilidad Conjunta entre dos variables (x 1, x 2 ) o bien (x, y) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa. Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. Si Cov(x,y) es cero: no existe asociación entre x e y. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
39
39 MEDIDAS DE ASOCIACIÓN LINEAL - Covarianza - Correlación DatosCuantitativos Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal entre dos variables Cuantitativas Se refiere al grado de asociación entre dos variables (x 1, x 2 ) o bien (x, y) Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es perfecta. Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es perfecta. Si r es cero: no existe asociación entre x e y. Correlación: Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
40
40 r=1 r=-1 EJEMPLO : Representación gráfica de las variables x e y Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
41
41 Objetivo 2 Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra REGRESION LINEAL SIMPLE Datos Cuantitativos Determinar si existe relación entre las variables x e y: Coeficiente de Correlación Objetivo 1 Determinar si dos variables están asociadas y en qué sentido se da la asociación. Modelo de Regresión Estudiar la dependencia de una variable respecto de la otra: Modelo de Regresión Términos Variable Respuesta (=variable dependiente) Variable Explicativa (=variable Independiente) Relación Lineal (modelo lineal) Parámetros (intercepto y pendiente) Intercepto (respuesta media) Pendiente (efecto de la variable explicativa sobre la respuesta) Error (residuo) Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
42
42 REGRESION LINEAL SIMPLE Datos Cuantitativos Notación Variable Respuesta: y Variable Explicativa: x Modelo de Regresión Lineal Simple: y i = + x i +e i Intercepto: Pendiente: Error: e Modelo Estimado (recta de regresión) Mínimos Cuadrados Método de Estimación: Mínimos Cuadrados Residuos o Errores Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
43
43 REGRESION LINEAL SIMPLE DATOS MODELO DE REGRESIÓN LINEAL SIMPLE y i = + x i +e i MODELO ESTIMADO ESTIMADORES ERRORES Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Desviación típica residual: s r Representa la variabilidad promedio de los datos observados con relación a la recta de regresión.
44
44 REGRESION LINEAL SIMPLE MODELO DE REGRESIÓN LINEAL SIMPLE y i = + x i +e i MODELO ESTIMADO Una Variable Respuesta (y) una Variable Explicativa (x) Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 x y Desviación típica residual: s r Representa la variabilidad promedio de los datos observados con relación a la recta de regresión. Recta estimada
45
45 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
46
46 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. Interpretación de los resultados - Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta. -Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm. Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
47
47 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R 2 cercano a 1) Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007
48
48 Histograma para la variable Talla (y) Histograma para los errores (e) Algunos Gráficos que se observan en Regresión Diagrama de Dispersión Edad (x) v/s Talla (y) Recta de regresión estimada Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 - La media de los errores o residuos es cero. - La desviación típica residual, representa la variabilidad promedio de los datos observados con relación a la recta de regresión.
49
49 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Correlación y causalidad Si el coeficiente de correlación entre dos variables es alto (cercano a -1 o a 1), indica que estas dos variables toman valores que están relacionados entre si, pero no permite concluir una relación causal entre esas variables. Ejemplo: se tienen dos variables “el número de matrimonios mensual en una ciudad” y “la temperatura promedio mensual” en un periodo determinado. El coeficiente de correlación entre estas dos variables es igual a 0,70. - Las dos variables muestran una asociación, pero no podemos pensar que el número de matrimonios aumente con la temperatura, ni que una ola de calor produzca mayor numero de matrimonios. - A este tipo correlación se denomina correlación espuria.
50
50 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1. Análisis de datos. 2. Análisis de datos bivariantes. 3. Correlación y regresión. 4. Series temporales y números índice. 5. Probabilidad. 6. Variables aleatorias. 7. Modelos discretos. 8. Modelos continuos. 9. Variables aleatorias multidimensionales: la distribución normal bivariante. Programa de la asignatura
51
51 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 1.Introducción 2.Clasificación de las series temporales (serie estacionaria y serie no estacionaria) 3.Descomposición básica de una serie temporal (tendencia, estacionalidad, componente irregular) 4.Análisis de la tendencia (método de la tendencia determinista, método de la tendencia evolutiva y método de diferenciación de la serie) 5.Análisis de la estacionalidad (tabla de doble entrada, coeficiente de estacionalidad y desestacionalización de la serie) Resumen de conceptos involucrados: Una serie temporal puede ser estacionaria o no estacionaria. Una serie temporal esta compuesta por la tendencia (creciente o decreciente), la estacionalidad y un componente irregular. El análisis de la tendencia se puede realizar a través del método de la tendencia determinista (recta de regresión), método de la tendencia evolutiva (media móvil de orden tres y de orden cinco) y método de diferenciación de la serie. En el análisis de estacionalidad se organizan los datos en una tabla de doble entrada, se calculan coeficientes de estacionalidad y se realiza una desestacionalización de la serie.
52
52 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 1.- Introducción Una serie temporal corresponde a una variable registrada a lo largo del tiempo. La variable será de tipo cuantitativa y la unidad de tiempo estará dado según el registro de esa variable, este puede ser cada hora, diariamente, semanalmente, mensualmente, anualmente, etc. El análisis de series temporales tiene como fin explicar la evolución de una variable en el tiempo y prever sus valores futuros. Ejemplos: 1.El ingreso diario de pacientes a la unidad de emergencia de un hospital: la variable es el número de pacientes que ingresan y la unidad de tiempo es diariamente. 2.En un supermercado se tienen las ventas semanales de un producto determinado: la variable es el número de ventas del producto y la unidad de tiempo es semanalmente. 3.Una empresa estudia la tasa de ausentismo laboral mensual en un periodo de 10 años: La variable es la tasa de ausentismo y la unidad de tiempo es mensualmente. 4.En un país se realiza un estudio sobre la proporción de mujeres que ingresan a la universidad sobre el total de ingresos anuales desde el año 1980 a 2006: la variable es la proporción de mujeres y unidad de tiempo es anualmente.
53
53 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales Representación gráfica de una serie temporal La representación gráfica principal de una serie de tiempo es por medio de un gráfico temporal. El gráfico temporal se construye situando los valores que toma la serie en el eje de las ordenadas (eje y) y los instantes temporales correspondientes en el eje de las abscisas (eje x). En el cuadro 1 se puede observar 4 tipos de series para distintas variables medidas en las unidades de tiempo correspondiente. 1.Serie A: Número de reclamaciones semanales presentadas en el servicio de atención al cliente de una empresa de servicios (30 semanas). 2.Serie B: Número de Ventas cuatrimestrales de un nuevo producto (30 cuatrimestres correspondiente a 7 años y medio) 3.Serie C: Número de pasajeros mensuales transportados por avión en vuelos internacionales (144 meses correspondiente a 12 años). 4.Serie D: Precio diario de una acción en dólares (100 días).
54
54 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales Cuadro 1: Grafico temporal para la serie A, serie B, serie C y serie D.
55
55 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE ESTACIONARIA En esta serie la media y la variabilidad son constantes en el tiempo. En el gráfico temporal se observa que los valores que toma la serie tienden a oscilar alrededor de una media constante, y la variabilidad de la serie respecto de la media permanece también constante en el tiempo. Para este tipo de serie tiene sentido calcular la media y la desviación estándar (o típica) y construir un histograma. Un ejemplo se observa en cuadro 2 y cuadro 3.
56
56 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE ESTACIONARIA Cuadro 2: Grafico de una serie temporal estacionaria.Cuadro 3: Histograma de una serie temporal estacionaria.
57
57 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE NO ESTACIONARIA En esta serie la media y/o la variabilidad cambian a lo largo del tiempo. El cambio de la media se traduce en la presencia de una tendencia a crecer o decrecer, por lo que la serie no tiende a oscilar alrededor de un valor constante o de referencia. Este tipo de series son dinámicas o evolutivas. Una serie no estacionaria puede ser estacional, es decir, que la serie tiene una pauta de evolución que se repite de un año a otro. Es importante destacar que por definición, una serie anual no puede ser nunca estacional, sin embargo las series mensuales o diarias pueden presentar estacionalidad, debida al mes o al día. Ejemplos de series estacionarias se observan en el cuadro 4.
58
58 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. Cuadro 4: Gráfico temporal para la serie B, serie C y serie D. La serie B y la serie D son no estacionales. La serie C es estacional: tiene una pauta de evolución que se repite
59
59 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal Los métodos descriptivos clásicos pueden aplicarse a series temporales estacionarias, pero no para las no estacionarias. Una serie no estacionaria presenta unas características que permiten descomponerla. En éstas se puede identificar una tendencia constante o no constante y también se puede observar la estacionalidad. La descripción de una serie temporal supone que la serie observada es la suma de tres componentes distintos: 1.La tendencia: que se identifica con un movimiento suave de la serie a largo plazo. Es una pauta regular que evoluciona lentamente en el tiempo creciendo o decreciendo, tal como se observa en el cuadro 5. 2.La estacionalidad: que son movimientos de oscilación dentro del año, tal como se observa en el cuadro 6. 3.El irregular: que incluye las variaciones aleatorias alrededor de los componentes anteriores.
60
60 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular 1.- La tendencia 2.- La estacionalidad Cuadro 5: Gráfico temporal para series con tendencia creciente y decreciente.
61
61 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular 2.- La estacionalidad Cuadro 6: Gráfico temporal de la serie C que es creciente y presenta estacionalidad (en los meses de enero de cada año hay menor Nº de pasajeros que en julio)
62
62 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular La serie temporal no estacionaria se puede escribir como: Valor observado= tendencia + estacionalidad + irregular donde T t es la tendencia, S t es la estacionalidad e I t el componente irregular.
63
63 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia Para analizar la tendencia de una serie partiremos del supuesto que la serie no tiene estacionalidad (la estacionalidad se verá más adelante). Es decir, la serie a analizar es no estacionaria, no tiene estacionalidad, puede presentar una tendencia creciente o decreciente y posee un componente aleatorio irregular, esto se representa por el siguiente esquema: Valor observado= tendencia + irregular Para calcular la tendencia se puede plantear una hipótesis sobre la forma de T t ; tenemos dos casos: 1.Suponer que T t es una función determinista del tiempo, por ejemplo una línea recta. Bajo este supuesto estudiaremos un método de tendencia determinista. 2.Suponer que T t es una función no determinista desconocida, pero que evoluciona suavemente a lo largo del tiempo. Bajo este supuesto estudiaremos un método de tendencia evolutiva. Un método más general consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo y suponer que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. Para esto estudiaremos un método de diferenciación de la serie que elimina la tendencia de la serie. M1 M2 M3
64
64 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Representamos la tendencia de una serie temporal por una línea recta. La ecuación de la recta se calculará mediante una ecuación de regresión donde la variable dependiente es la serie observada y la variable explicativa es el tiempo. El objetivo es obtener la tendencia y posteriormente el componente irregular. La tendencia en t esta dada por la siguiente ecuación de regresión: Considerando Donde a y b son constantes a determinar y t es la variable tiempo. Para obtener la pendiente (b) y el intercepto (a) de la recta, se debe calcular lo siguiente: La tendencia estará dada por: La componente irregular estará dada por:
65
65 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Los datos se organizarán de la siguiente forma: Datos observadosDatos a estimar txtxt TtTt ItIt 1x1x1 T1T1 I1I1 2x2x2 T2T2 I2I2 3x3x3 T3T3 I3I3 NxNxN TNTN ININ La tendencia estará dada por: La componente irregular estará dada por:
66
66 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Ejemplo : Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad. - El esquema propuesto es: donde x t = venta, T t = tendencia e I t es el componente irregular o residuo en el tiempo t. - La tendencia se estima mediante un modelo de regresión: - La variable tiempo (t ) toma los valores del 1 al 30. - La media para el tiempo es: - La varianza para el tiempo es: - La media de la serie de ventas es: - La covarianza entre la serie de ventas y la variable t es: - La pendiente de la recta de regresión es: - El intercepto de la recta de regresión es: - La tendencia estimada esta dada por: - Los residuos o componente irregular están dados por:
67
67 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad. En el cuadro 7 se puede observar gráficamente el comportamiento de los datos de la serie comparado con la tendencia estimada y los errores o componentes irregulares. Cuadro 7: contiene en (a) el gráfico de la recta de tendencia y datos de la serie de ventas y en (b) el grafico de los componentes irregulares (residuos) y la recta de la tendencia. Observación: Ajustar un línea recta a la tendencia tiene la ventaja de la simplicidad. Puede servir para describir algunas series cuyo gráfico temporal muestra claramente una tendencia lineal, sin embargo no es aplicable a las series donde no se observa un incremento o decremento continuado y constante a lo largo del tiempo.
68
68 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Un procedimiento más realista que el del ajuste de la línea recta, es suponer que la tendencia T t es una función, pero que evoluciona lentamente, y en consecuencia, puede aproximarse en intervalos muy cortos (por ejemplo de 3 o 5 datos) por una función simple del tiempo. En general se supone una recta, pero ahora sus coeficientes van cambiando suavemente en el tiempo. Para estimar la tendencia T t tenemos que asumir que en períodos cortos los coeficientes son constantes. En concreto, suponiendo que la representación de la tendencia por una recta es válida para tres períodos consecutivos, t-1, t, t+1, se tendrá:--- En consecuencia, se obtiene la media de tres observaciones consecutivas (t-1, t y t+1): A esta operación se le denomina Media Móvil centrada de orden tres.
69
69 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media Móvil centrada de orden tres Observación: Utilizando la igualdad se obtiene: Como el componente irregular tiene media cero, la media de tres valores del irregular puede suponerse despreciable frente a la tendencia y m t recoge principalmente en cada instante la tendencia de la serie en dicho momento. La Media Móvil centrada de orden tres, proporciona aproximadamente la tendencia en cada punto. El calculo de la componente irregular se efectúa después restando a los valores la tendencia, es decir:
70
70 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva La Media Móvil centrada de orden tres es: La componente irregular es: Calculando la media móvil de orden tres los datos se organizarán de la siguiente forma: Datos observadosDatos a estimar txtxt m t =T t ItIt 1x1x1 -- 2x2x2 m2m2 I2I2 3x3x3 m3m3 I3I3 N-1x N-1 m N-1 I N-1 NxNxN --
71
71 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva La Media Móvil de orden cinco se calcula con 5 observaciones consecutivas (t-2, t-1, t, t+1 y t+2): La componente irregular es: Calculando la media móvil de orden cinco los datos se organizarán de la siguiente forma: Datos observadosDatos a estimar txtxt M t =T t ItIt 1x1x1 -- 2x2x2 -- 3x3x3 M3M3 I3I3 4x4x4 M4M4 I4I4 5x5x5 M5M5 I5I5 N-2x N-2 M N-2 I N-2 N-1x N-1 -- NxNxN -- Observación: la tendencia con una media móvil de orden cinco es más suave que con la media móvil de orden tres.
72
72 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media Móvil de orden tres y de orden cinco Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (m t ) y la media móvil de orden cinco (M t ). Algunos de los datos de la tendencia (m t y M t ) obtenidos son los siguientes: tventasmtmt MtMt 113,16 240,0724,3 319,6323,921,3 411,8917,721,6 521,6116,117,9 614,8519,318,6 721,5419,920,3 823,2821,720,8 920,3022,622,4 De las 30 observaciones, calculando la Media Móvil de orden tres se obtienen 28 observaciones de tendencia; y calculando la Media Móvil de orden cinco se obtienen 26 observaciones de tendencia.
73
73 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media móvil de orden tres y de orden cinco Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (m t ) y la media móvil de orden cinco (M t ). Algunos de los datos de la tendencia (m t y M t ) obtenidos son los siguientes: Cuadro 8: Tendencia de ventas obtenida por la media móvil de orden tres (a) y de orden cinco (b). Observación: desde el cuadro 8 se puede ver que la tendencia de las ventas con la media móvil de orden cinco es más suave que con la de orden tres.
74
74 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Este método más general para calcular la tendencia, consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo. Supone únicamente que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. En consecuencia, si se resta a cada valor de la serie el valor anterior, la serie resultante estará aproximadamente libre de la tendencia. Esta operación se denomina diferenciar la serie y consiste en pasar de la serie x t a una nueva serie y t, que se construye mediante: Este procedimiento equivale a suponer que la tendencia en t es el valor de la serie en t-1. Por lo tanto la serie diferenciada equivale al componente irregular. Este método es más general ya que no requiere de ninguna hipótesis sobre la forma de la tendencia. Este método es el más utilizado en la actualidad.
75
75 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Calculando la serie diferenciada, los datos se organizarán de la siguiente forma:
76
76 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Ejemplo: Para las series no estacionarias presentadas en el cuadro 4 (Serie B, Serie C y Serie D) se eliminará la tendencia mediante la diferenciación, quedando la componente irregular (I t ). La siguiente tabla contiene la diferenciación para seis casos de las series b, c y d; y la representación gráfica de la componente irregular para todos los datos se puede observar en el cuadro 9.
77
77 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Ejemplo: Para las series no estacionarias del cuadro 4 (Serie B, Serie C y Serie D) se eliminó la tendencia mediante la diferenciación, quedando la componente irregular (I t ). Cuadro 9: Representación gráfica de la diferenciación de las series B,C y D.
78
78 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad Siempre que se recogen datos igualmente espaciados es esperable un efecto estacional, por ejemplo cuando se observan datos mensuales o semanales a través del tiempo. Para analizar la estacionalidad, se requiere disponer los datos en una tabla de doble entrada, donde los valores de la serie se organizan según las opciones de tiempo, tal como se observa en el cuadro 10, donde cada tabla reúne los valores de la serie según (1) mes y año, (2) semana y mes, (3) día y semana. Cuadro 10: Tres ejemplos de organización de los valores que toma la serie en una tabla de doble entrada.
79
79 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad El análisis de estacionalidad se basa en el cálculo de las medias por filas, por columnas y la media global. 1.Al restar la media global a la media de cada fila se obtienen los coeficientes estacionales. Para los ejemplos presentados en el cuadro 10, los coeficientes estacionales representan como se sitúa (1) la media de cada mes respecto de la media global; (2) la media de cada semana respecto de la media global y (3) la media de cada día respecto de la media global. 2.Las medias de las columnas indican la tendencia de la serie. Al restar la media global a la media de cada columna se obtiene el comportamiento relativo. Para los ejemplos presentados en el cuadro 9, se tendría (1) la media de cada año menos la media global; (2) la media de cada mes menos la media global y (3) la media de cada semana respecto de la media global. 3. Se denomina serie desestacionalizada a una serie donde se ha eliminado el efecto estacional. Esta serie se construye restando a los valores de cada fila el coeficiente estacional correspondiente. Ejemplo: Para la serie mensual de pasajeros transportados por avión en vuelos internacionales (c), se realiza un análisis de la estacionalidad (ver cuadro 11), es decir se organizan los datos por mes y año, se calcula la media global, las medias por mes (fila ), las medias por año (columna), el coeficiente de estacionalidad por mes; y se construye la serie desestacionalizada.
80
80 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad ( 5.- Análisis de Estacionalidad (Coeficientes Estacionales, Tendencia de la Serie, Serie Desestacionalizada) = tendencia de la serie Cuadro 11: Análisis de estacionalidad para la serie mensual de pasajeros transportados por avión en vuelos internacionales.
81
81 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto (veremos 3) : - Para calcular este índice hay que identificar el producto a evaluar y el valor que toma éste en una unidad de tiempo, por ejemplo año. - Hay que determinar un año base, al que se le denomina período base del índice. - La Elección del año base es arbitraria y representa el momento temporal de referencia para las comparaciones. a) Índice de precio (I t ) = - Permite comparar la evolución de productos distintos. - Si se comparan tres productos hay que seleccionar el mismo año base para construir el índice, esto permite hacer la comparación de la variación del precio de los productos. año1 litro leche100 grs azafran1 kg carne 199070100001200 199175120001250 199277160001280 199377200001300 199485250001375 199590220001450 añoÍndice lecheÍndice azafranÍndice carne 1990100 1991107,1120104,2 1992110160106,7 1993110200108,3 1994121,4250114,6 1995128,6220120,8 Precios a) Índice de precio ( I t )
82
82 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto : b) Índice de precio relativo respecto al año base= - Proporciona de manera directa los crecimientos relativos respecto del año base. - Por ejemplo: para la leche índice de precio relativo respecto del año base, representa el incremento (en este caso) porcentual respeto del año base. - Es decir, en el año 1991 la leche incrementó su precio en un 7,1% respecto del año 1990; y un 10% en el año 1992 (también respecto del año base 1990) año1 litro leche100 grs azafran1 kg carne 199070100001200 199175120001250 199277160001280 199377200001300 199485250001375 199590220001450 Precios b) Índice de precio relativo al año base año Índice lecheÍndice azafránÍndice carne 1990000 19917,1204,2 199210606,7 1993101008,3 199421,415014,6 199528,612020,8
83
83 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto : c) Índice de precio relativo respecto del año anterior = (donde P 0 es el precio en el año base) = Proporciona los crecimientos relativos con relación a cualquier otro período. c) Índice de precio relativo al año anterior añoÍndice lecheÍndice azafranÍndice carne 1990100 1991107,1120104,2 1992110160106,7 1993110200108,3 1994121,4250114,6 1995128,6220120,8 a) Índice de precio ( I t ) año Índice lecheÍndice azafranÍndice carne 1990 -- - 19917,1204,2 19922,733,32,4 1993025,01,5 199410,425,05,8 19955,9-125,4
84
84 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 2) Número índice con agregación simple a) Índice agregado: Promedio de índices individuales = - Este índice evita la unidad de medida de los precios de los productos al incorporar en su cálculo los índices de precio, considerando un año base. - Su ventaja es la simplicidad. - El inconveniente es que da el mismo peso a todos los productos. año1 litro leche100 grs azafran1 kg carne 199070100001200 199175120001250 199277160001280 199377200001300 199485250001375 199590220001450 Precios año Índice lecheÍndice azafránÍndice carne Índice agregado 1990100 1991107,1120104,2 110,4 1992110160106,7 125,6 1993110200108,3 139,4 1994121,4250114,6 162,0 1995128,6220120,8 156,5 Índice agregado
85
85 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 3) Número índice con agregación ponderada a) Índice agregado ponderado: Índice A P = - Considera las ponderaciones de los precios sobre un año base - Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos. Índice agregado ponderado Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne Año 1990lecheazafráncarne Consumo2701150 Precio1890010000180000208900 Ponderación0,09050,04790,86171 añoÍndice lecheÍndice azufranÍndice carneÍndice AP 1990100 1991107,1120104,2105,2 1992110160106,7109,6 1993110200108,3112,8 1994121,4250114,6121,7 1995128,6220120,8126,3
86
86 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 3) Número índice con agregación ponderada b) Índice agregado ponderado: Índice de Laspeyres = C i año Base : es la cantidad de producto i en el año base. Precio i año t : es el precio del producto i en el año t. Precio i año Base : es el precio del producto i en el año año base. - Este índice tiene en cuenta la importancia relativa de los producto en el consumo. - Necesitamos conocer la cantidad de producto consumida en el año base. - No da el mismo peso a todos los productos. - Los resultados son iguales al índice AP Índice Laspeyres Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne año1 litro leche100 grs azafran1 kg carneÍndice Laspeyres 199070100001200100 199175120001250105,2 199277160001280109,5 199377200001300112,9 199485250001375121,7 199590220001450126,3 Según se observa el índice AP (a) posee una formula distinta que el índice de Laspeyres (b), pero generan los mismos resultados.
87
87 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Í ndice de precios al consumo (IPC) - El IPC se calcula mensualmente por el Instituto Nacional de Estadísticas (INE). - Refleja la evolución de los precios para la familia media Española - Es un índice de Laspeyres que compara el valor cada mes de un conjunto de artículos con su valor en el período de referencia; éste se denomina Laspeyres encadenado - El período de referencia se modifica aproximadamente cada 10 años, para tener en cuenta los cambios en la estructura del consumo de la población española. - La distribución de los gastos de las familias (o ponderaciones) se estima realizando una encuesta que se conoce como Encuesta de presupuestos Familiares (EPF) - Describe la evolución de los precios de consumo en un país a lo largo del tiempo. - El porcentaje de variación o de crecimiento del IPC se puede calcular para cada año, mes, etc, utilizando el índice de precio relativo:
88
88 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Í ndice de precios al consumo (IPC) GruposAño 2006, IPC base 2001Año 2007, IPC base 2006 Alimentos y bebidas no alcohólicas22,2822,06 Bebidas alcohólicas y tabaco3,072,82 Vestido y calzado9,259,03 Vivienda10,7110,36 Menaje6,176,15 Medicina2,722,83 Transporte14,9114,89 Comunicaciones3,283,58 Ocio y cultura6,787,11 Enseñanza1,681,6 Hoteles, cafés y restaurantes11,4511,55 Otros bienes y servicios7,728,02 General100 IPC, base 2006. Ponderaciones (Fuente INE)
89
89 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Í ndice de precios al consumo (IPC) Ejemplo del calculo del porcentaje de variación (o crecimiento) añoIPC% variación 198774,9 - 198878,54,8 198983,96,9 199089,56,7 199194,85,9 19921005,5 19931055,0 19941104,8 1995115,14,6
90
90 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Probabilidades Contenidos: -Conceptos básicos de experimento aleatorio, espacio muestral, suceso, probabilidad, etc. -Calculo de probabilidades: reglas básicas, Probabilidad condicionada, regla de Bayes, Independencia -Concepto de variable aleatoria. -Modelos probabilísticos para variables discretas. -Modelos probabilísticos para variables continuas.
91
91 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Experimento Aleatorio (E) Es cualquier proceso en el cual se recoge información de un fenómeno que presenta variación en sus resultados. Ejemplos: E 1 : Medir la concentración de gases contaminantes en los tubos de escape de un conjunto de vehículos. E 2 : Lanzar un dado y observar el Nº sobre la cara superior. E 3 : Damos una dosis de vitaminas a un niño y observamos el peso y la estatura del niño después de 12 semanas. Espacio Muestral (EM) Es el conjunto de todos los posibles resultados de un Experimento. Ejemplos: EM 1 : Si x=% de gases contaminantes, los posibles resultados en E 1 son EM 2 : Si x=Nº en la cara superior, los posibles resultados en E 2 son EM 3 : Si x = peso ganado, y =estatura ganada; los posibles resultados en E 3 son - Experimento Aleatorio - Espacio Muestral - Evento o Suceso PROBABILIDAD Principales Conceptos
92
92 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 - Experimento Aleatorio - Espacio Muestral - Evento o Suceso PROBABILIDAD Principales Conceptos Evento o Suceso Sea un Experimento (E) y su Espacio Muestral (EM): “un Evento o Suceso es cualquier subconjunto del EM”. A cada uno de los resultados en el EM se le llama Evento Simple o Suceso Elemental. del ejemplo anterior En EM 1 algunos eventos son, En EM 2 algunos eventos son A=“Nº par”, B=“Nº impar”, C=“Nº 4”. En EM 3 algunos eventos son donde B es un evento Simple (suceso elemental)
93
93 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Sean A y B dos sucesos cualquiera: Se escribe (A B) si ocurre A o si ocurre B o ambos Se escribe (A B) si ocurre A y B A C representa el complemento de A, cuando no ocurre A ocurre A C. Definición 1: Si A y B son eventos, se dice que A y B son excluyentes o mutuamente excluyentes si no pueden ocurrir simultáneamente, es decir, (A B) = . E: Lanzar un dado y observar el número en la cara superior. EM= {1, 2, 3, 4, 5, 6} A={4}, B=Nº impar={1, 3, 5} (A B) = (A y B son excluyentes) Ejemplos : E: Determinar si una persona porta o no un arma blanca. EM= {si, no} A={si}, B={no} (A B) = (A y B son excluyentes) - Experimento Aleatorio - Espacio Muestral - Evento o Suceso PROBABILIDAD Propiedades
94
94 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 - Experimento Aleatorio - Espacio Muestral - Evento o Suceso PROBABILIDAD Propiedades Sean A y B dos sucesos cualquiera: Se escribe (A B) si ocurre A o si ocurre B o ambos Se escribe (A B) si ocurre A y B A C representa el complemento de A, cuando no ocurre A ocurre A C. Definición 2: Sea E un experimento y EM el espacio muestral, con cada suceso A se asocia un número que medirá la probabilidad de que A ocurra, donde P(A) será la probabilidad de A. Si EM={A 1, A 2,...,A r } con s=1, 2,..., r. 1)0 P(A i ) 1 2)P(EM)=1 3)Si A 1,A 2,...,A r son sucesos mutuamente excluyentes, es decir (A i A j ) = ; la probabilidad de la unión de todos los sucesos es: P(A 1 )+ P(A 2 )+... +P(A r )=
95
95 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD PROBABILIDAD Propiedades 1.- Si es un conjunto vacío (suceso imposible) la probabilidad es cero: -P( )=0 -(A ) =A P(A ) = P(A) + P( )= P(A) -(A ) = , A y son sucesos excluyentes 2.- Si A un suceso cualquiera y A C un suceso complementario, EM={A,A C }: -P(A) + P(A C ) =1 -P(A) =1- P(A C ) -P(A C ) =1- P(A) -P(EM)=P(A A C )= P(A) + P(A C ) 3.- Sean A y B sucesos cualquiera: -P(A B)= P(A) + P(B)- P(A B) -Si A y B son sucesos independientes: P(A B)=P(A ) P(B) -Si A y B son sucesos excluyentes: P(A B)= 4.- Sean A y B sucesos tales que B A: P(B) P(A) 5.- Sean A, B y C sucesos cualquiera: -P(A B C)= P(A) + P(B)+ P(C)- P(A B)- P(A C)- P(B C) + P(A B C)
96
96 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Definición 3: Sea E un experimento y EM el espacio muestral, A es el suceso de interés, entonces P(A)= (Nº de elementos de A) / (Nº de elementos en EM) Observación: la dificultad en el calculo de la probabilidad está en determinar el Nº de elementos en el espacio muestral. E: se lanzan 2 dados y se observan los números en las caras superiores. EM= {(1,1) (1,2) (1,3).....(6,6)} A= La suma de los números de las caras superiores es 4. A ={(1,3) (3,1) (2,2)} Ejemplo : Problema Problema: Determinar probabilidad de A Nº de elementos en EM= 36 Nº de elementos en A= 3 P(A)=3/36=0,083 (8,3%) Ejercicio: Experimento: lanzar una moneda; Suceso A: que salga cara; calcular P(A). Obtener la frecuencia relativa del suceso A: cuando el experimento se repite 30 veces, 50 veces y 100 veces.
97
97 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 1) Una persona tiene 20 lápices en su bolso, 4 de los cuales no funcionan, si tiene que firmar una carta y saca al azar un lápiz del bolso, ¿cuál es la probabilidad de que saque un lápiz bueno?. E: Sacar un lápiz del bolso. EM= {L1, L2, L3, L4, L5, L6, L7, L8, L9, L10, L11, L12, L13, L14, L15, L16, L17, L18, L19, L20} A= Sacar un lápiz bueno. Nº de elementos en EM= 20; Nº de elementos en A= 16; P(A)=16/20= 0,8 (80%) PROBABILIDAD Ejemplos 2) Una bolsa de caramelos de 3 sabores (Sandía, Naranja y Limón) contiene 20 unidades de las cuales el 50% es de Limón, el 25% de Sandía y el otro 25% de Naranja. Si un niño saca al azar un caramelo: a) ¿Cuál el la probabilidad que saque uno de limón? b) ¿Cuál es la probabilidad que saque uno de sandia? c) ¿Cuál es la probabilidad que saque uno de naranja? Si el niño saca al azar dos caramelos: a) ¿Cuál es la probabilidad que los dos sean de limón? b) ¿Cuál es la probabilidad que los dos sean de naranja? c) ¿Cuál es la probabilidad que uno sea de sandía y otro de naranja? En este ejemplo determine: Experimento, Espacio Muestral, Suceso y probabilidad del Suceso
98
98 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento” PROBABILIDAD Técnicas de Conteo - Principio Multiplicativo - Permutaciones - Combinaciones 1.- PRINCIPIO MULTIPLICATIVO - Suponemos un Experimento que consiste en k etapas o procedimientos, donde la etapa e i puede tener n i posibles resultados, i=1,...k. - En el experimento, cada una de las formas de efectuar e 1 puede ser seguida por cualquiera de los resultados de e 2 y así sucesivamente por cualquiera hasta concretar la última etapa del experimento, que es e k. - Por lo tanto el experimento puede tener (n 1 x n 2 x … x n k ) posibles resultados. Ejemplo: 1) Sea E= se lanza un dado 2 veces: e 1 = lanzar el dado por primera vez y e 2 = lanzar el dado por segunda vez. Los posibles resultados en cada etapa del experimento son: n 1 =6 y n 2 = 6. El número posible de resultados es: n 1 n 2 = 6 6=36.
99
99 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Técnicas de Conteo - Principio Multiplicativo - Permutaciones - Combinaciones 1.- PRINCIPIO MULTIPLICATIVO Ejemplo 2) ¿De cuantas formas se puede vestir una persona que tiene 3 pantalones diferentes, 2 camisas distintas y 2 pares de zapatos?. E= la persona se viste: e 1 = se pone pantalón, e 2 = se pone camisa y e 3 = se pone zapatos. Los posibles resultados en cada etapa del experimento son: n 1 =3, n 2 = 2 y n 3 = 2. El número posible de formas de vestirse es: n 1 n 2 n 3 = 3 *2* 2=12. “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
100
100 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Técnicas de Conteo - Principio Multiplicativo - Permutaciones - Combinaciones 2.- PERMUTACIONES y 3) COMBINACIONES PERMUTACIÓN: Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. El Nº de posibles resultados en un experimento es COMBINACIÓN: Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. El Nº de posibles resultados en un experimento es donde n!=1 x 2 x 3 x … x (n-1) x n por ejemplo 3!= 1 x 2 x 3 = 6 “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
101
101 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Técnicas de Conteo - Principio Multiplicativo - Permutaciones - Combinaciones 2.- PERMUTACIONES y 3) COMBINACIONES PERMUTACIÓN: COMBINACIÓN: Ejemplo: Se tienen 4 banderas (Roja, Amarilla, Verde Blanca) ¿Cuántas señales se pueden tener mezclando 2 banderas? Rpta.: E= de 4 banderas sacar dos banderas y formar señales EM={RA, AR, RV, VR, RB, BR, AV, VA, AB, BA, VB, BV} A= la señal tiene una bandera Roja P(A)= 6/12=0,5 Ejemplo: Hay cuatro personas (Ana, Rosa, Miguel Claudia) ¿Cuántos grupos se pueden tener mezclando 2 personas? Rpta.: E= de 4 personas formar grupos de 2 EM={AR, AM, AC, RM, RC, MC} A= el grupo esta formado sólo por mujeres P(A)= 3/6=0,5 B= el grupo es mixto P(B)=3/6=0,5 “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento”
102
102 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD PROBABILIDAD CONDICIONADA -La idea de probabilidad condicionada permite incorporar información relevante para hallar la probabilidad de un suceso. - La expresión de la probabilidad condicionada es la siguiente: sabiendo que es decir, los dos sucesos ocurren al mismo tiempo Ejemplo: En una población de N mujeres y hombres, donde N M son mujeres y N H son hombres, se sabe que N c consumen cierto producto, de los cuales N cM mujeres consumen ese producto. Experimento: se elige al azar una persona y se le pregunta si consume el producto. A: la persona consume el producto. Si sabemos que la persona seleccionada es mujer, la probabilidad de que consuma el producto condicionada a que es mujer se obtiene como sigue: A: la persona consume el producto; B: la persona es mujer.Esquemáticamente: E B A
103
103 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD REGLA DE BAYES - En algunos casos, el espacio muestral de un Experimento se puede partir en varios sucesos, los llamaremos B 1, B 2, …, B r, incompatibles entre si o excluyentes (no hay intersección), tal como se presenta en el esquema: - En ese mismo experimento existe un suceso A cualquiera de nuestro interés, representado en el siguiente esquema: -La probabilidad del suceso A puede calcularse a partir de las probabilidades de A condicionado por los diferentes sucesos B 1, B 2, …, B r, utilizando la formula de probabilidad total: -Sobre la base de la formula anterior, se puede calcular la probabilidad de que ocurra el suceso B i (i=1,2,…,r) dado el suceso A mediante la formula:
104
104 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD REGLA DE BAYES -La probabilidad del suceso A: -La Prob. que ocurra el sucesoB i (i=1,2,…,r) dado el suceso A: -Ejemplo -Ejemplo: Estudio de la situación laboral de los trabajadores en 4 sectores de la economía, denotados por B 1, B 2, B 3 y B 4. a) Interesa determinar la probabilidad que una persona este en paro y b) de que una persona que esta sin trabajo pertenezca al segundo sector Sea el suceso A: estar sin trabajo (estar en paro) - La probabilidad de que una persona este sin trabajo en el sector B 1 es P(A/B 1 )=0,05 - La probabilidad de que una persona este sin trabajo en el sector B 2 es P(A/B 2 )=0,01 - La probabilidad de que una persona este sin trabajo en el sector B 3 es P(A/B 3 )=0,02 -La probabilidad de que una persona este sin trabajo en el sector B 4 es P(A/B 4 )=0,1 Se sabe que la mitad de las personas pertenecen al primer sector y y el resto se divide en partes iguales entre los otros 3, por lo tanto: - La probabilidad de que una persona proceda del sector B 1 es P(B 1 )=0,5 - La probabilidad de que una persona proceda de los sectores B 2, B 3 y B 4 es P(B 2 ) = P(B 3 ) = P(B 4 ) = 0,16 a) La probabilidad que una persona este en paro es: b) La probabilidad que una persona que está sin trabajo pertenezca al sector 2 (B 2 ) es:
105
105 Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD INDEPENDENCIA independientes - Dos sucesos son independientes cuando la aparición de uno de ellos no modifica la probabilidad de que ocurra el otro. Por lo tanto, dos sucesos A y B son independientes si: Si A y B son independientes, entonces: Ejemplo a: no hay independencia entre los sucesos A y B Experimento: se lanza dos veces un dado equilibrado. El suceso A: en el segundo lanzamiento sale un Nº par. El suceso B: La suma de los resultados es al menos 9 -Los elementos de A son {12, 22, 32, 42, 52, 62,14, 24, 34, 44, 54, 64, 16, 26, 36, 46, 56, 66} -Los elementos de B son { 63, 36, 54, 45, 64, 46, 56, 65, 66, 55} -Los elementos de A y B son {54, 64, 36, 46, 56, 66} Por lo tanto:, y Ejemplo b: hay independencia entre los sucesos A y B Experimento: se lanza dos veces una moneda equilibrada donde {CC, CX, XC, XX} El suceso A: en primer lanzamiento sale cara A={CC, CX}. El suceso B en el segundo sale cara, B={XC,CC}. Que resulte A y B es {CC}. La P(A)=2/4=0,5 y P(B)=2/4=0,5 y P(AyB)=1/4=0,25 por lo tanto P(AyB)=P(A) x P(B)=0,5 x 0,5 = 0,25
106
106
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.