La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introducción a la Estadística

Presentaciones similares


Presentación del tema: "Introducción a la Estadística"— Transcripción de la presentación:

1 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Programa de la asignatura 1. Análisis de datos. 2. Análisis de datos bivariantes. 3. Correlación y regresión. 4. Series temporales y números índice. 5. Probabilidad. 6. Variables aleatorias. 7. Modelos discretos. 8. Modelos continuos. 9. Variables aleatorias multidimensionales: la distribución normal bivariante. Organización de la asignatura Clases teóricas y clases prácticas de ordenador. Se valorará positivamente la asistencia a las clases prácticas. Las prácticas se realizarán en aulas informáticas en horarios preestablecidos. Se utilizará el programa STATGRAPHICS. Profesora: Mónica Catalán Reyes

2 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Organización de las prácticas Las prácticas de la asignatura serán realizadas con el paquete estadístico Statgraphics. En la biblioteca se puede conseguir un CD con una versión para estudiantes. El mínimo de prácticas en ordenador son 5: - Análisis de datos Univariante - Análisis de datos Bivariante - Regresión - Distribuciones (generación de datos por simulación) - Series temporales. Evaluación de la asignatura La evaluación de la asignatura será el examen final. Se contara positivamente la entrega de un trabajo y ejercicios, estas dos tareas sumarán como máximo 0,5 puntos a la nota del examen. El trabajo consistirá en analizar una base de datos con dos variables cuantitativas. Realizar el análisis por separado de las variables (univariante) y el conjunto (bivariante) hasta el ajuste de un modelo de regresión. Profesora: Mónica Catalán Reyes

3 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Bibliografía PEÑA, D. y ROMO, J.: Introducción a la Estadística para las Ciencias Sociales. McGraw Hill, New York, 1997. PEÑA, D.: Estadística. Modelos y Métodos, segunda edición, Alianza Universidad Textos, Madrid, 2001. Bibliografía Complementaria MOORE, D. S.: The Basic Practice of Statistics, segunda edición, Freeman and Co., 2000. - NEWBOLD, P.: Statistics for business and economics, cuarta edición, Prentice Hall, Englewood Cliffs, 1996. Profesora: Mónica Catalán Reyes

4 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción El objetivo del curso es la Introducción a los conceptos fundamentales del Análisis de Datos y de la Probabilidad. ¿Qué es la estadística? Es una poderosa herramienta para generar conocimiento que ha experimentado un gran desarrollo a lo largo del tiempo. ¿En qué áreas se aplica la estadística? Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas, entre otras. Ejemplos de su aplicación son: 1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo. 2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.

5 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de su aplicación son: 3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos. 4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad. 5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa). 6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población. En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer predicciones sobre ellas.

6 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Etapas de un estudio estadístico Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el llamado método científico cuyas etapas son: Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población. Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación. Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio. Inferencia estadística: consiste en suponer un modelo para la población e interpretación de los datos a la luz del modelo para obtener conclusiones generales. Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población

7 Introducción a la Estadística INFERENCIA ESTADÍSTICA
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Esquema de las etapas de un estudio estadístico AREA DE INTERES DATOS ORGANIZAR Y RESUMIR Tema de Investigación Antecedentes Previos Objetivos Preguntas de Investigación Posibles Hipótesis Unidad de Análisis Población Variables ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.) INTERPRETACIÓN Muestra ¿Población o Muestra? INFERENCIA ESTADÍSTICA Población CONCLUSIONES Probabilidad INFORMACIÓN

8 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

9 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Introducción Ejemplos de algunos problemas a estudiar 1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de la persona empleada. 2) Se quiere determinar el perfil de los trabajadores en términos de condiciones económicas y sociales en diferentes comunidades. 3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a vestuario, alimentación, ocio y vivienda. 4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas. 5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de distintas empresas del país. 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad. 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características.

10 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Resumen de algunos conceptos planteados en la Introducción VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Población: “Las personas que trabajan en empresas de comunicación” Muestra Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. Mónica Catalán Reyes-2007

11 Herramientas Estadísticas
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Resumen de algunos conceptos planteados en la Introducción Problema de Investigación Antecedentes Previos Objetivo Preguntas de Investigación Posibles Hipótesis Unidad de Análisis Población Variables Respuesta al problema de investigación INFORMACIÓN Herramientas Estadísticas Mónica Catalán Reyes-2007

12 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 ACTIVIDAD 1 Vamos a trabajar en los siguientes problemas de investigación: 6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad; y 7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una Universidad, y si éste tiene alguna relación con su edad u otras características. Definir: Población bajo estudio, unidad de análisis, variables de interés.

13 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 El total de elementos de la población serán N y los de la muestra n MUESTRA La muestra se genera a través de algún tipo de muestreo PROBABILISTICO NO PROBABILISTICO - Todas las unidades de la población tienen alguna probabilidad de ser seleccionadas. - Para obtener la muestra se requiere tener identificados los elementos de la población. -  Los elementos de la población se identifican a través de un listado de elementos, denominado marco muestral. - Para obtener una muestra se requiere de datos previos acerca de la población. - Una de sus ventajas es que puede medirse el tamaño del error en las predicciones. Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Mónica Catalán Reyes-2004

14 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 El total de elementos de la población serán N y los de la muestra n MUESTRA La muestra se genera a través de algún tipo de muestreo PROBABILISTICO NO PROBABILISTICO - Este tipo de muestra también se denomina muestra dirigida. Suponen un procedimiento de selección informal y un poco arbitrario. La elección de los elementos no depende de la probabilidad, sino de causas relacionadas con las características del investigador. Son utilizadas en algunas investigaciones y a partir de ellas se hacen inferencias hacia la población. La muestra dirigida selecciona sujetos típicos, con la esperanza de que serán casos representativos de una población determinada. Muestra de sujetos voluntarios Muestra de expertos Muestra de sujetos-tipo Muestra por cuotas

15 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Variable: corresponde a la característica de la Unidad de Análisis TIPOS DE VARIABLES Variables Cuantitativas Variables Cualitativas CONTINUA DISCRETA NOMINAL ORDINAL Tipos de escala Intervalo o Razón Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso (escala de Razón); Estatura (escala de Razón); Temperatura (Escala de Intervalo), etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc. Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no afecta la descripción de la variable. Escala Intervalo: Tiene un cero arbitrario y al cambiar de unidad de medida cambia la descripción de la variable. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura

16 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se presenta una característica. Variable Cuantitativa Variable Cualitativa Variable Cualitativa Variable Cuantitativa CONTINUA NOMINAL NOMINAL CONTINUA DISCRETA ORDINAL ORDINAL DISCRETA Frecuencia Absoluta (F) Frecuencia Relativa (f) TIPO FRECUENCIA Frecuencia Absoluta Acumulada (FAA) Frecuencia Relativa Acumulada (fra)

17 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO Variables - Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal) - Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa discreta) - Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de producción. (cuantitativa continua) - Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos estándares (Muy Bien, Bien, Regular, Mal). (cualitativa ordinal) Datos

18 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO TABLAS DE FRECUENCIA (2) (1) (3) (4)

19 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en función de algunas características. Unidad de Análisis: Industria de Conserva Población: Industrias de Conservas del país EJEMPLO 1) Titulo General Elementos que observamos en las TABLAS 2) Titulo por columna/fila Auto-explicativa 3) Frecuencias 4) Fuente Tabla 1: Distribución de las Industrias de Conservas de acuerdo a Tipo de Industria desde tabla de frecuencias (1) Fuente: Informe 2006, Ministerio de Industria y Energía

20 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Pregunta: ¿Cómo se construye una tabla cuando la variable es Cuantitativa (x)? 1) Determinar el número de clases o intervalos (k) (C1, C2, ..., Ck): Total de unidades de análisis (n) Regla de Sturges: k =1 + 3,3 logn 2) Determinar amplitud del intervalo - Valor mínimo que toma la variable en el grupo, min(xi) i=1, 2,...,n. Valor máximo que toma la variable en el grupo, max(xi) i=1, 2,...,n. Rango= max(xi)-min(xi) = R Amplitud =(R+1)/k = a 3) Construir los intervalos: Límite inferior y Limite superior de cada intervalo LIj =Límite inferior de la clase j, j=1, 2,...,k LSj =Límite superior de la clase j, j=1, 2,...,k LI1 = min(xi)-(1/2) LS1 = LI1 + a LI2 = LS1 LS2 = LI2+ a .....

21 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Respuesta: Confeccionar la tabla aplicando el procedimiento anterior Elementos de una tabla de frecuencia cuando la variable es continua (x) [LI1 ; LS1 [ [LI2 ; LS2 [ [LIk ; LSk] cj = (LIj) + LSj )/2 aj = (LSj – LIj))

22 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Ejercicio: confección de una tabla de frecuencia para una variable continua Los datos corresponden a la edad de los hijos de los trabajadores de una empresa Realice la siguiente actividad Construya un Diagrama de Tallo y Hoja ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. Sobre una Tabla de frecuencia: ¿Cuántos intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para cada intervalo?. Construir tabla de frecuencia para la variable: Intervalos, centro de clase, amplitud, frecuencias. Datos ordenados de menor a mayor Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos. Mónica Catalán Reyes-2004

23 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)

24 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 2. Gráfico de Barras Este tipo de gráfico se utiliza generalmente para representar la frecuencia de las categorías de una variable cualitativa. Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha transformada en categorías. Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos grupos.

25 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 3. Histograma Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Histograma - Permite la representación de la frecuencia de una variable Cuantitativa. El eje x se refiere a la variable. El eje y se refiere a la frecuencia (Nº , %). Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra). El histograma se puede construir desde los datos de la tabla de frecuencia de la variable en estudio. edad Ejemplo En el gráfico se puede observar el número de hijos de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 años.

26 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Polígono de Frecuencia Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Esta representación se basa en el Histograma. Sólo es útil para variables cuantitativas. El eje x se refiere a la variable. El eje y se refiere a la frecuencia (Nº , %). Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase). edad

27 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 Permite identificar gráficamente la media, los percentiles 25 y 75, mínimo y máximo de una variable. Sólo es útil para variables cuantitativas. El eje x permite identificar la poblacion en estudio. El eje y representa los valores de la variable en estudio.

28 mínimo Introducción a la Estadística TIPOS DE GRÁFICOS
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 máximo Percentiles 75 media Permite identificar gráficamente la media, los percentiles 25 y 75, mínimo y máximo de una variable. Sólo es útil para variables cuantitativas. El eje x permite identificar la poblacion en estudio. El eje y representa los valores de la variable en estudio. media Percentil 25 mínimo

29 mínimo Introducción a la Estadística TIPOS DE GRÁFICOS
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 5. Diagrama de Caja Edad de las personas que se realizaron angioplastía entre 1980 y 2000 máximo  Medidas Descriptivas Mujeres Hombres N 584 1473 Media (o promedio) 63,3 59,2 Varianza 109,6 111,9 Desv.Típica (o Desv. Estándar) 10,5 10,6 Coeficiente Variación 0,2 Mínimo 25 23 Percentil 25 57 52 mediana 64 59 Percentil 75 70 67 Máximo 93 92 Moda 66 56 Percentiles 75 media media Percentil 25 mínimo

30 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS 6. Otros

31 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 TIPOS DE GRÁFICOS OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia. * Al igual que las tablas, los gráficos deben ser auto-explicativos.

32 Introducción a la Estadística Variables Cuantitativas
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 NOTACION Variables Cuantitativas OBSERVACIONES * El Tipo de Gráfico seleccionado va a depender de la variable en estudio. * El Gráfico debe contener un Título General y la identificación de cada eje (variable en estudio y frecuencia). * En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia. * Al igual que las tablas, los gráficos deben ser auto-explicativos.

33 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media Aritmética (Promedio) Mediana Moda MEDIDAS DE TENDENCIA CENTRAL Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor Mediana Media Aritmética o Promedio Si n es impar Si n es par Datos Cualitativos y Cuantitativos Moda

34 Introducción a la Estadística Percentiles, Deciles o Cuartiles
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Percentil (ejemplo: 25, 50, 75) Decil (ejemplo: 4, 5, 8) Cualtil (ejemplo: 1, 2, 3) Percentiles, Deciles o Cuartiles Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos están ordenados de Menor a Mayor El Percentil va de 1 a 100 El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20. Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22. El Decil va de 1 a 10 El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32. Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34. El Cuartil va de 1 a 4 El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60. Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

35 Introducción a la Estadística Comparación entre Variables
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Rango Varianza Desviación Estándar MEDIDAS DE DISPERSIÓN Datos Cuantitativos Varianza Rango Desviación Estándar Comparación entre Variables Se refiere al comportamiento de las variables cuantitativas en un grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta mayor variación? Coeficiente de Variación

36 Introducción a la Estadística Otras medidas o Coeficientes
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Asimetría Kurtosis o Apuntamiento Otras medidas o Coeficientes Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias es la simetría y el apuntamiento o kurtosis. Si CA=0 si la distribución es simétrica alrededor de la media. Si CA<0 si la distribución es asimétrica a la izquierda Si CA>0 si la distribución es asimétrica a la derecha Coeficiente de Asimetría - Si CAp=3 la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica. - Si CAp>3, la distribución es más puntiaguda que la anterior y se llama leptocúrtica, (mayor concentración de los datos en torno a la media). - Si CAp<3 la distribución es más plana y se llama platicúrtica. Coeficiente de Apuntamiento

37 Introducción a la Estadística Otras medidas o Coeficientes
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Asimetría Kurtosis o Apuntamiento Otras medidas o Coeficientes Ejemplos

38 Introducción a la Estadística Otras medidas o Coeficientes
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Asimetría Kurtosis o Apuntamiento Otras medidas o Coeficientes Ejemplos Histograma Datos Medidas descriptivas 1 4 5 2 6 3 7 Media 3,9 Error típico 0,30 Mediana 4 Moda Desviación estándar 1,67 Varianza de la muestra 2,78 kurtosis -0,43 Coeficiente de asimetría -0,02 Rango 6 Mínimo 1 Máximo 7 Cuenta 30

39 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Rango Intercuatilico (RI): es la diferencia entre el tercer y el primer cuartil RI=C3-C1 Del ejemplo anterior se tiene que Q1=C1=3 y Q3=C3=5 por lo tanto RI= 5-3=2 Comparación de la Media y la Mediana: Robustez Los datos atípicos son datos extremos o lejanos de la mayoría de las observaciones. La media y la mediana tienen un comportamiento diferente frente a los datos atípicos La media en su calculo considera todos los datos, incluyendo los datos atípicos. La mediana es una medida que se ve poco afectada por los datos atípicos, no los considera en su calculo dado que separa los datos. Sobre la base de lo anterior, la mediana es una medida robusta en comparación con la media.

40 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos agrupados esta dada por: n1 f1 n2 f2 3) El Coeficiente de Asimetría para datos agrupados esta dado por: nk fk Sea cj la marca de clase (o centro de clase) y fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. 1) La Media para datos agrupados es igual a la suma de los productos de las marcas de clase por sus frecuencias relativas, de la forma: 4) El Coeficiente de apuntamiento para datos agrupados esta dada por:

41 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para datos Agrupados (tabla de frecuencias) Tabla de frecuencia (para variable cuantitativa) 5) La Mediana para datos agrupados es igual a la clase o intervalo que concentra al menos el 50% de los datos. Para esto se observan las frecuencias relativas acumuladas n1 f1 FA1 fa1 n2 f2 FA2 fa2 nk fk 6) El cuartil 1 (Q1 o C1) para datos agrupados es igual a la clase o intervalo que concentra al menos el 25% de los datos. Observar las frecuencias relativas acumuladas. Sea cj la marca de clase (o centro de clase), fj la frecuencia relativa de la clase j, donde j=1, 2,…, k. Sea Faj la frecuencia absoluta acumulada de la clase j y faj la frecuencia relativa acumulada de la clase j, donde j=1, 2,…, k. 6) El cuartil 3 (Q3 o C3) para datos agrupados es igual a la clase o intervalo que concentra al menos el 75% de los datos. Observar las frecuencias relativas acumuladas. Se pueden obtener percentiles y deciles

42 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Problema Interesa estudiar cual es el principal medio de transporte preferido por un grupo de personas a la hora de dirigirse al centro comercial. Para esto se consultó a cada persona sobre la actividad a la que se dedicaba y el medio de transporte preferido. Tabla 1 Actividad Transporte Estudia Pensionado Trabaja Autobus 5 7 Bicicleta 3 2 Caminar Coche 4 Metro 6 Transporte % Autobus 12 20,0 Bicicleta 8 13,3 Caminar 9 15,0 Coche 14 23,3 Metro 17 28,3 TOTAL 60 100 Actividad % Estudia 21 35,0 Pensionado 26 43,3 Trabaja 13 21,7 TOTAL 60 100

43 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas Tabla 2 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 12 Bicicleta 3 2 8 Caminar 9 Coche 4 14 Metro 6 17 21 26 13 60 Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

44 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Transporte Tabla 3 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 12 % 41,7 58,3 100 Bicicleta 3 2 8 37,5 25 Caminar 9 22,2 55,6 Coche 4 14 35,7 28,6 Metro 6 17 35,3 41,2 23,5 21 26 13 60 35 43,3 21,7

45 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cualitativas Distribución conjunta Nº de personas y % respecto de tipo de Actividad Tabla 4 Actividad Transporte Estudia Pensionado Trabaja TOTAL Autobus 5 7 12 % 23,8 26,9 20 Bicicleta 3 2 8 14,3 11,5 15,4 13,3 Caminar 9 9,5 19,2 15 Coche 4 14 38,5 23,3 Metro 6 17 28,6 30,8 28,3 21 26 13 60 100

46 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Resumen: análisis de frecuencia de 2 variables cualitativas Si tenemos dos variables cualitativas podemos construir una tabla de doble entrada con las frecuencias absolutas Fij, donde i=1, 2,…, m y j=1, 2,…, k. La frecuencia relativa conjunta se obtiene dividiendo cada Fij por n y se escribe fij. La distribución marginal de la 1ª variable se obtiene calculando i=1,2,…,m La distribución marginal de la 2ª variable se obtiene calculando j=1,2,…,k La distribución condicionada se refiere a estudiar la distribución de una variable dado un nivel o categoría de la otra variable.

47 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. Distribución conjunta Nº fallos Nº piezas 1 2 3 Total 4 5 11 8 6 16 9 12 20 15 21 41 43 45 104 Calcular lo siguiente Distribución relativa conjunta Distribución del número de fallos condicionada a 3 piezas. La media del numero de fallos La media del numero de piezas La media del numero de fallos condicionada a las 2 piezas Nº piezas Nº máquinas 11 1 16 2 3 20 4 41 Total 104 Nº fallas Nº maquinas 1 16 2 43 3 45 Total 104

48 Introducción a la Estadística Descripción de 2 variables cuantitativas
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Problema Interesa estudiar el numero de piezas que se le cambiaron a las máquinas que fallaron un número determinado de veces en un año. Para esto se tiene el registro de una partida de 104 máquinas que presentaron fallas en una región. Solución Distribución relativa conjunta  y Nº fallos Nº piezas 1 2 3 Total 0,038 0,048 0,019 0,106 0,077 0,058 0,154 0,029 0,087 0,115 0,192 4 0,144 0,202 0,394 0,413 0,433 Media Nº de piezas=2,62 Media de fallos=2,28 distribución del numero de fallas condicionada a 3 piezas Nº fallos Nº piezas 1 2 3 Total x=3 0,1 0,3 0,6 la media de fallos condicionada a 3 piezas es: 2,50 Calcular lo siguiente Distribución relativa conjunta Distribución del número de fallos condicionada a 3 piezas. La media del numero de fallos La media del numero de piezas La media del numero de fallos condicionada a las 2 piezas Nº piezas 1 2 3 Total x=2 0,1875 0,5625 0,25 la media de fallos condicionada a 2 piezas es: 2,06 Cov(x,y)= ( , ,048+… ,202)- 2,62.2,28 =6,19-5,96 = 0,23

49 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Descripción de 2 variables cuantitativas Si se tienen 2 variables cuantitativas discretas que se miden a un conjunto de unidades se puede construir: Tablas de doble entrada de frecuencias a absolutas y de frecuencias relativas. Distribución marginal de cada variable. Distribución de una variable condicionada a una categoría de la otra. Distribución conjunta Frecuencia Absolutas Frecuencia Relativas Medidas que se pueden calcular Media o promedio de x y de y Covarianza de x con y Desviación típica de x y de y Correlación de x con y

50 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Ejemplo 1 Sobre los datos que se tienen para el curso Aplicar todo lo visto hasta ahora sobre estadística descriptiva, no olvide identificar el problema, la unidad de análisis, las variables en estudio (definición de cada una de ellas donde se identifique la unidad de medida para las variables cuantitativas y las categorías de las variables cualitativas).

51 Introducción a la Estadística MEDIDAS DE ASOCIACIÓN LINEAL
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Covarianza Correlación Datos Cuantitativos MEDIDAS DE ASOCIACIÓN LINEAL Recordemos que: Hasta ahora hemos estudiado las medidas tendencia central (Media, Mediana, Moda) y dispersión (Varianza y Desviación Estándar) para una Variable Cuantitativa (x). Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y) Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa. Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. Si Cov(x,y) es cero: no existe asociación entre x e y.

52 Introducción a la Estadística MEDIDAS DE ASOCIACIÓN LINEAL
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Covarianza Correlación Datos Cuantitativos MEDIDAS DE ASOCIACIÓN LINEAL Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y) Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal entre dos variables Cuantitativas Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es perfecta. Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es perfecta. Si r es cero: no existe asociación entre x e y.

53 r=1 r=-1 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 EJEMPLO : Representación gráfica de las variables x e y r=1 r=-1

54 REGRESION LINEAL SIMPLE
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Datos Cuantitativos REGRESION LINEAL SIMPLE Objetivo 1 Determinar si dos variables están asociadas y en qué sentido se da la asociación. Objetivo 2 Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra  Determinar si existe relación entre las variables x e y: Coeficiente de Correlación Estudiar la dependencia de una variable respecto de la otra: Modelo de Regresión Términos Variable Respuesta (=variable dependiente) Variable Explicativa (=variable Independiente) Relación Lineal (modelo lineal) Parámetros (intercepto y pendiente) Intercepto (respuesta media) Pendiente (efecto de la variable explicativa sobre la respuesta) Error (residuo)

55 REGRESION LINEAL SIMPLE
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Datos Cuantitativos REGRESION LINEAL SIMPLE Notación Variable Respuesta: y Variable Explicativa: x Modelo de Regresión Lineal Simple: yi=+xi+ei Intercepto:  Pendiente:  Error: e Modelo Estimado (recta de regresión) Método de Estimación: Mínimos Cuadrados Residuos o Errores

56 REGRESION LINEAL SIMPLE yi=+xi+ei
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 REGRESION LINEAL SIMPLE MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei ERRORES DATOS MODELO ESTIMADO Desviación típica residual: sr Representa la variabilidad promedio de los datos observados con relación a la recta de regresión. ESTIMADORES

57 REGRESION LINEAL SIMPLE yi=+xi+ei
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 REGRESION LINEAL SIMPLE Una Variable Respuesta (y) una Variable Explicativa (x) MODELO ESTIMADO MODELO DE REGRESIÓN LINEAL SIMPLE yi=+xi+ei Desviación típica residual: sr Representa la variabilidad promedio de los datos observados con relación a la recta de regresión. y Recta estimada x

58 REGRESION LINEAL SIMPLE
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

59 REGRESION LINEAL SIMPLE
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. Interpretación de los resultados - Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a medida que la edad aumenta la talla aumenta. Desde los resultados del modelo de regresión lineal simple, se tiene que la talla media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en una unidad la talla se incrementa en 2,44 cm.

60 REGRESION LINEAL SIMPLE
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 REGRESION LINEAL SIMPLE EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad. De acuerdo al coeficiente de determinación, el modelo ajustado a los datos es adecuado (R2 cercano a 1)

61 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Algunos Gráficos que se observan en Regresión Diagrama de Dispersión Edad (x) v/s Talla (y) Histograma para la variable Talla (y) Recta de regresión estimada Histograma para los errores (e) - La media de los errores o residuos es cero. - La desviación típica residual, representa la variabilidad promedio de los datos observados con relación a la recta de regresión.

62 Introducción a la Estadística Correlación y causalidad
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Correlación y causalidad Si el coeficiente de correlación entre dos variables es alto (cercano a -1 o a 1), indica que estas dos variables toman valores que están relacionados entre si, pero no permite concluir una relación causal entre esas variables. Ejemplo: se tienen dos variables “el número de matrimonios mensual en una ciudad” y “la temperatura promedio mensual” en un periodo determinado. El coeficiente de correlación entre estas dos variables es igual a 0,70. Las dos variables muestran una asociación, pero no podemos pensar que el número de matrimonios aumente con la temperatura, ni que una ola de calor produzca mayor numero de matrimonios. A este tipo correlación se denomina correlación espuria.

63 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Programa de la asignatura 1. Análisis de datos. 2. Análisis de datos bivariantes. 3. Correlación y regresión. 4. Series temporales y números índice. 5. Probabilidad. 6. Variables aleatorias. 7. Modelos discretos. 8. Modelos continuos. 9. Variables aleatorias multidimensionales: la distribución normal bivariante.

64 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales Introducción Clasificación de las series temporales (serie estacionaria y serie no estacionaria) Descomposición básica de una serie temporal (tendencia, estacionalidad, componente irregular) Análisis de la tendencia (método de la tendencia determinista, método de la tendencia evolutiva y método de diferenciación de la serie) Análisis de la estacionalidad (tabla de doble entrada, coeficiente de estacionalidad y desestacionalización de la serie) Resumen de conceptos involucrados: Una serie temporal puede ser estacionaria o no estacionaria. Una serie temporal esta compuesta por la tendencia (creciente o decreciente), la estacionalidad y un componente irregular. El análisis de la tendencia se puede realizar a través del método de la tendencia determinista (recta de regresión), método de la tendencia evolutiva (media móvil de orden tres y de orden cinco) y método de diferenciación de la serie. En el análisis de estacionalidad se organizan los datos en una tabla de doble entrada, se calculan coeficientes de estacionalidad y se realiza una desestacionalización de la serie.

65 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 1.- Introducción Una serie temporal corresponde a una variable registrada a lo largo del tiempo. La variable será de tipo cuantitativa y la unidad de tiempo estará dado según el registro de esa variable, este puede ser cada hora, diariamente, semanalmente, mensualmente, anualmente, etc. El análisis de series temporales tiene como fin explicar la evolución de una variable en el tiempo y prever sus valores futuros. Ejemplos: El ingreso diario de pacientes a la unidad de emergencia de un hospital: la variable es el número de pacientes que ingresan y la unidad de tiempo es diariamente. En un supermercado se tienen las ventas semanales de un producto determinado: la variable es el número de ventas del producto y la unidad de tiempo es semanalmente. Una empresa estudia la tasa de ausentismo laboral mensual en un periodo de 10 años: La variable es la tasa de ausentismo y la unidad de tiempo es mensualmente. En un país se realiza un estudio sobre la proporción de mujeres que ingresan a la universidad sobre el total de ingresos anuales desde el año 1980 a 2006: la variable es la proporción de mujeres y unidad de tiempo es anualmente.

66 Series Temporales Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales Representación gráfica de una serie temporal La representación gráfica principal de una serie de tiempo es por medio de un gráfico temporal. El gráfico temporal se construye situando los valores que toma la serie en el eje de las ordenadas (eje y) y los instantes temporales correspondientes en el eje de las abscisas (eje x). En el cuadro 1 se puede observar 4 tipos de series para distintas variables medidas en las unidades de tiempo correspondiente. Serie A: Número de reclamaciones semanales presentadas en el servicio de atención al cliente de una empresa de servicios (30 semanas). Serie B: Número de Ventas cuatrimestrales de un nuevo producto (30 cuatrimestres correspondiente a 7 años y medio) Serie C: Número de pasajeros mensuales transportados por avión en vuelos internacionales (144 meses correspondiente a 12 años). Serie D: Precio diario de una acción en dólares (100 días).

67 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales Cuadro 1: Grafico temporal para la serie A, serie B, serie C y serie D.

68 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE ESTACIONARIA En esta serie la media y la variabilidad son constantes en el tiempo. En el gráfico temporal se observa que los valores que toma la serie tienden a oscilar alrededor de una media constante, y la variabilidad de la serie respecto de la media permanece también constante en el tiempo. Para este tipo de serie tiene sentido calcular la media y la desviación estándar (o típica) y construir un histograma. Un ejemplo se observa en cuadro 2 y cuadro 3.

69 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE ESTACIONARIA Cuadro 2: Grafico de una serie temporal estacionaria. Cuadro 3: Histograma de una serie temporal estacionaria.

70 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. SERIE NO ESTACIONARIA En esta serie la media y/o la variabilidad cambian a lo largo del tiempo. El cambio de la media se traduce en la presencia de una tendencia a crecer o decrecer, por lo que la serie no tiende a oscilar alrededor de un valor constante o de referencia. Este tipo de series son dinámicas o evolutivas. Una serie no estacionaria puede ser estacional, es decir, que la serie tiene una pauta de evolución que se repite de un año a otro. Es importante destacar que por definición, una serie anual no puede ser nunca estacional, sin embargo las series mensuales o diarias pueden presentar estacionalidad, debida al mes o al día. Ejemplos de series estacionarias se observan en el cuadro 4.

71 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- Clasificación de las series temporales Las series temporales se clasifican inicialmente en dos grupos, serie estacionaria y serie no estacionaria. Cuadro 4: Gráfico temporal para la serie B, serie C y serie D. La serie B y la serie D son no estacionales. La serie C es estacional: tiene una pauta de evolución que se repite

72 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal Los métodos descriptivos clásicos pueden aplicarse a series temporales estacionarias, pero no para las no estacionarias. Una serie no estacionaria presenta unas características que permiten descomponerla. En éstas se puede identificar una tendencia constante o no constante y también se puede observar la estacionalidad. La descripción de una serie temporal supone que la serie observada es la suma de tres componentes distintos: La tendencia: que se identifica con un movimiento suave de la serie a largo plazo. Es una pauta regular que evoluciona lentamente en el tiempo creciendo o decreciendo, tal como se observa en el cuadro 5. La estacionalidad: que son movimientos de oscilación dentro del año, tal como se observa en el cuadro 6. El irregular: que incluye las variaciones aleatorias alrededor de los componentes anteriores.

73 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 2.- La estacionalidad 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular 1.- La tendencia Cuadro 5: Gráfico temporal para series con tendencia creciente y decreciente.

74 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular 2.- La estacionalidad Cuadro 6: Gráfico temporal de la serie C que es creciente y presenta estacionalidad (en los meses de enero de cada año hay menor Nº de pasajeros que en julio)

75 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 3.- Descomposición básica de una serie temporal: Tendencia, Estacionalidad y componente Irregular La serie temporal no estacionaria se puede escribir como: Valor observado= tendencia + estacionalidad + irregular donde Tt es la tendencia, St es la estacionalidad e It el componente irregular.

76 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia Para analizar la tendencia de una serie partiremos del supuesto que la serie no tiene estacionalidad (la estacionalidad se verá más adelante). Es decir, la serie a analizar es no estacionaria, no tiene estacionalidad, puede presentar una tendencia creciente o decreciente y posee un componente aleatorio irregular, esto se representa por el siguiente esquema: Valor observado= tendencia + irregular Para calcular la tendencia se puede plantear una hipótesis sobre la forma de Tt; tenemos dos casos: Suponer que Tt es una función determinista del tiempo, por ejemplo una línea recta. Bajo este supuesto estudiaremos un método de tendencia determinista. Suponer que Tt es una función no determinista desconocida, pero que evoluciona suavemente a lo largo del tiempo. Bajo este supuesto estudiaremos un método de tendencia evolutiva. M1 M2 Un método más general consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo y suponer que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. Para esto estudiaremos un método de diferenciación de la serie que elimina la tendencia de la serie. M3

77 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Representamos la tendencia de una serie temporal por una línea recta. La ecuación de la recta se calculará mediante una ecuación de regresión donde la variable dependiente es la serie observada y la variable explicativa es el tiempo. Considerando El objetivo es obtener la tendencia y posteriormente el componente irregular. La tendencia en t esta dada por la siguiente ecuación de regresión: Donde a y b son constantes a determinar y t es la variable tiempo. Para obtener la pendiente (b) y el intercepto (a) de la recta, se debe calcular lo siguiente: La tendencia estará dada por: La componente irregular estará dada por:

78 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Los datos se organizarán de la siguiente forma: Datos observados Datos a estimar t xt Tt It 1 x1 T1 I1 2 x2 T2 I2 3 x3 T3 I3 N xN TN IN La tendencia estará dada por: La componente irregular estará dada por:

79 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad. El esquema propuesto es: donde xt = venta, Tt= tendencia e It es el componente irregular o residuo en el tiempo t. - La tendencia se estima mediante un modelo de regresión: La variable tiempo (t ) toma los valores del 1 al 30. - La media para el tiempo es: - La varianza para el tiempo es: - La media de la serie de ventas es: - La covarianza entre la serie de ventas y la variable t es: - La pendiente de la recta de regresión es: - El intercepto de la recta de regresión es: - La tendencia estimada esta dada por: - Los residuos o componente irregular están dados por:

80 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M1: Método de tendencia determinista Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia mediante la recta de regresión. Recordar que esta serie no es estacionaria y se analiza bajo el supuesto que no tiene estacionalidad. En el cuadro 7 se puede observar gráficamente el comportamiento de los datos de la serie comparado con la tendencia estimada y los errores o componentes irregulares. Cuadro 7: contiene en (a) el gráfico de la recta de tendencia y datos de la serie de ventas y en (b) el grafico de los componentes irregulares (residuos) y la recta de la tendencia. Observación: Ajustar un línea recta a la tendencia tiene la ventaja de la simplicidad. Puede servir para describir algunas series cuyo gráfico temporal muestra claramente una tendencia lineal, sin embargo no es aplicable a las series donde no se observa un incremento o decremento continuado y constante a lo largo del tiempo.

81 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Un procedimiento más realista que el del ajuste de la línea recta, es suponer que la tendencia Tt es una función, pero que evoluciona lentamente, y en consecuencia, puede aproximarse en intervalos muy cortos (por ejemplo de 3 o 5 datos) por una función simple del tiempo. En general se supone una recta, pero ahora sus coeficientes van cambiando suavemente en el tiempo. Para estimar la tendencia Tt tenemos que asumir que en períodos cortos los coeficientes son constantes. En concreto, suponiendo que la representación de la tendencia por una recta es válida para tres períodos consecutivos, t-1, t, t+1, se tendrá: - En consecuencia, se obtiene la media de tres observaciones consecutivas (t-1, t y t+1): A esta operación se le denomina Media Móvil centrada de orden tres.

82 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media Móvil centrada de orden tres Observación: Utilizando la igualdad se obtiene: Como el componente irregular tiene media cero, la media de tres valores del irregular puede suponerse despreciable frente a la tendencia y mt recoge principalmente en cada instante la tendencia de la serie en dicho momento. La Media Móvil centrada de orden tres, proporciona aproximadamente la tendencia en cada punto. El calculo de la componente irregular se efectúa después restando a los valores la tendencia, es decir:

83 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva La Media Móvil centrada de orden tres es: La componente irregular es: Calculando la media móvil de orden tres los datos se organizarán de la siguiente forma: Datos observados Datos a estimar t xt mt=Tt It 1 x1 - 2 x2 m2 I2 3 x3 m3 I3 N-1 xN-1 mN-1 IN-1 N xN

84 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva La Media Móvil de orden cinco se calcula con 5 observaciones consecutivas (t-2, t-1, t, t+1 y t+2): Datos observados Datos a estimar t xt Mt=Tt It 1 x1 - 2 x2 3 x3 M3 I3 4 x4 M4 I4 5 x5 M5 I5 N-2 xN-2 MN-2 IN-2 N-1 xN-1 N xN La componente irregular es: Calculando la media móvil de orden cinco los datos se organizarán de la siguiente forma: Observación: la tendencia con una media móvil de orden cinco es más suave que con la media móvil de orden tres.

85 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media Móvil de orden tres y de orden cinco Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes: t ventas mt Mt 1 13,16 2 40,07 24,3 3 19,63 23,9 21,3 4 11,89 17,7 21,6 5 21,61 16,1 17,9 6 14,85 19,3 18,6 7 21,54 19,9 20,3 8 23,28 21,7 20,8 9 20,30 22,6 22,4 De las 30 observaciones, calculando la Media Móvil de orden tres se obtienen 28 observaciones de tendencia; y calculando la Media Móvil de orden cinco se obtienen 26 observaciones de tendencia.

86 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M2: Método de tendencia evolutiva Media móvil de orden tres y de orden cinco Ejemplo: Para la Serie B, presentada en el cuadro 1, correspondiente a las ventas cuatrimestrales de un nuevo producto, se realiza un análisis de la tendencia utilizando la media móvil de orden tres (mt) y la media móvil de orden cinco (Mt). Algunos de los datos de la tendencia (mt y Mt ) obtenidos son los siguientes: Cuadro 8: Tendencia de ventas obtenida por la media móvil de orden tres (a) y de orden cinco (b). Observación: desde el cuadro 8 se puede ver que la tendencia de las ventas con la media móvil de orden cinco es más suave que con la de orden tres.

87 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Este método más general para calcular la tendencia, consiste en no hacer ninguna hipótesis sobre la forma de la ecuación de la tendencia a corto plazo. Supone únicamente que la tendencia evoluciona lentamente en el tiempo, de manera que en el instante t debe ser próxima a la tendencia en el instante t-1. En consecuencia, si se resta a cada valor de la serie el valor anterior, la serie resultante estará aproximadamente libre de la tendencia. Esta operación se denomina diferenciar la serie y consiste en pasar de la serie xt a una nueva serie yt, que se construye mediante: Este procedimiento equivale a suponer que la tendencia en t es el valor de la serie en t-1. Por lo tanto la serie diferenciada equivale al componente irregular. Este método es más general ya que no requiere de ninguna hipótesis sobre la forma de la tendencia. Este método es el más utilizado en la actualidad.

88 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Calculando la serie diferenciada, los datos se organizarán de la siguiente forma:

89 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Ejemplo: Para las series no estacionarias presentadas en el cuadro 4 (Serie B, Serie C y Serie D) se eliminará la tendencia mediante la diferenciación, quedando la componente irregular (It). La siguiente tabla contiene la diferenciación para seis casos de las series b, c y d; y la representación gráfica de la componente irregular para todos los datos se puede observar en el cuadro 9.

90 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 4.- Análisis de la tendencia M3: Método de diferenciación de la serie Ejemplo: Para las series no estacionarias del cuadro 4 (Serie B, Serie C y Serie D) se eliminó la tendencia mediante la diferenciación, quedando la componente irregular (It). Cuadro 9: Representación gráfica de la diferenciación de las series B,C y D.

91 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad Siempre que se recogen datos igualmente espaciados es esperable un efecto estacional, por ejemplo cuando se observan datos mensuales o semanales a través del tiempo. Para analizar la estacionalidad, se requiere disponer los datos en una tabla de doble entrada, donde los valores de la serie se organizan según las opciones de tiempo, tal como se observa en el cuadro 10, donde cada tabla reúne los valores de la serie según (1) mes y año, (2) semana y mes, (3) día y semana. Cuadro 10: Tres ejemplos de organización de los valores que toma la serie en una tabla de doble entrada.

92 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad El análisis de estacionalidad se basa en el cálculo de las medias por filas, por columnas y la media global. Al restar la media global a la media de cada fila se obtienen los coeficientes estacionales. Para los ejemplos presentados en el cuadro 10, los coeficientes estacionales representan como se sitúa (1) la media de cada mes respecto de la media global; (2) la media de cada semana respecto de la media global y (3) la media de cada día respecto de la media global. Las medias de las columnas indican la tendencia de la serie. Al restar la media global a la media de cada columna se obtiene el comportamiento relativo. Para los ejemplos presentados en el cuadro 9, se tendría (1) la media de cada año menos la media global; (2) la media de cada mes menos la media global y (3) la media de cada semana respecto de la media global. Se denomina serie desestacionalizada a una serie donde se ha eliminado el efecto estacional. Esta serie se construye restando a los valores de cada fila el coeficiente estacional correspondiente. Ejemplo: Para la serie mensual de pasajeros transportados por avión en vuelos internacionales (c), se realiza un análisis de la estacionalidad (ver cuadro 11), es decir se organizan los datos por mes y año, se calcula la media global, las medias por mes (fila ), las medias por año (columna), el coeficiente de estacionalidad por mes; y se construye la serie desestacionalizada.

93 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Series Temporales 5.- Análisis de Estacionalidad (Coeficientes Estacionales, Tendencia de la Serie, Serie Desestacionalizada) Cuadro 11: Análisis de estacionalidad para la serie mensual de pasajeros transportados por avión en vuelos internacionales. = tendencia de la serie

94 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto (veremos 3) : Para calcular este índice hay que identificar el producto a evaluar y el valor que toma éste en una unidad de tiempo, por ejemplo año. Hay que determinar un año base, al que se le denomina período base del índice. La Elección del año base es arbitraria y representa el momento temporal de referencia para las comparaciones. a) Índice de precio (It) = - Permite comparar la evolución de productos distintos. Si se comparan tres productos hay que seleccionar el mismo año base para construir el índice, esto permite hacer la comparación de la variación del precio de los productos. año 1 litro leche 100 grs azafran 1 kg carne 1990 70 10000 1200 1991 75 12000 1250 1992 77 16000 1280 1993 20000 1300 1994 85 25000 1375 1995 90 22000 1450 año Índice leche Índice azafran Índice carne 1990 100 1991 107,1 120 104,2 1992 110 160 106,7 1993 200 108,3 1994 121,4 250 114,6 1995 128,6 220 120,8 Precios a) Índice de precio (It)

95 Introducción a la Estadística b) Índice de precio relativo al año base
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto: b) Índice de precio relativo respecto al año base= Proporciona de manera directa los crecimientos relativos respecto del año base. Por ejemplo: para la leche índice de precio relativo respecto del año base, representa el incremento (en este caso) porcentual respeto del año base. Es decir, en el año 1991 la leche incrementó su precio en un 7,1% respecto del año 1990; y un 10% en el año 1992 (también respecto del año base 1990) b) Índice de precio relativo al año base año 1 litro leche 100 grs azafran 1 kg carne 1990 70 10000 1200 1991 75 12000 1250 1992 77 16000 1280 1993 20000 1300 1994 85 25000 1375 1995 90 22000 1450 año Índice leche Índice azafrán Índice carne 1990 1991 7,1 20 4,2 1992 10 60 6,7 1993 100 8,3 1994 21,4 150 14,6 1995 28,6 120 20,8 Precios

96 Números Índice Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 1) Número índice para un producto: c) Índice de precio relativo respecto del año anterior = (donde P0 es el precio en el año base) = Proporciona los crecimientos relativos con relación a cualquier otro período. c) Índice de precio relativo al año anterior año Índice leche Índice azafran Índice carne 1990 100 1991 107,1 120 104,2 1992 110 160 106,7 1993 200 108,3 1994 121,4 250 114,6 1995 128,6 220 120,8 año Índice leche Índice azafran Índice carne 1990 - 1991 7,1 20 4,2 1992 2,7 33,3 2,4 1993 25,0 1,5 1994 10,4 5,8 1995 5,9 -12 5,4 a) Índice de precio (It)

97 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 2) Número índice con agregación simple a) Índice agregado: Promedio de índices individuales = - Este índice evita la unidad de medida de los precios de los productos al incorporar en su cálculo los índices de precio, considerando un año base. Su ventaja es la simplicidad. El inconveniente es que da el mismo peso a todos los productos. Precios Índice agregado año 1 litro leche 100 grs azafran 1 kg carne 1990 70 10000 1200 1991 75 12000 1250 1992 77 16000 1280 1993 20000 1300 1994 85 25000 1375 1995 90 22000 1450 año Índice leche Índice azafrán Índice carne Índice agregado 1990 100 1991 107,1 120 104,2 110,4 1992 110 160 106,7 125,6 1993 200 108,3 139,4 1994 121,4 250 114,6 162,0 1995 128,6 220 120,8 156,5

98 Introducción a la Estadística Índice agregado ponderado
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 3) Número índice con agregación ponderada a) Índice agregado ponderado: Índice A P= Considera las ponderaciones de los precios sobre un año base Necesitamos conocer la cantidad de producto consumida en el año base. No da el mismo peso a todos los productos. Índice agregado ponderado Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne año Índice leche Índice azufran Índice carne Índice AP 1990 100 1991 107,1 120 104,2 105,2 1992 110 160 106,7 109,6 1993 200 108,3 112,8 1994 121,4 250 114,6 121,7 1995 128,6 220 120,8 126,3 Año 1990 leche azafrán carne Consumo 270 1 150 Precio 18900 10000 180000 208900 Ponderación 0,0905 0,0479 0,8617

99 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 3) Número índice con agregación ponderada b) Índice agregado ponderado: Índice de Laspeyres= Ci año Base: es la cantidad de producto i en el año base. Precioi año t: es el precio del producto i en el año t. Precioi año Base: es el precio del producto i en el año año base. - Este índice tiene en cuenta la importancia relativa de los producto en el consumo. Necesitamos conocer la cantidad de producto consumida en el año base. No da el mismo peso a todos los productos. Los resultados son iguales al índice AP Índice Laspeyres año 1 litro leche 100 grs azafran 1 kg carne Índice Laspeyres 1990 70 10000 1200 100 1991 75 12000 1250 105,2 1992 77 16000 1280 109,5 1993 20000 1300 112,9 1994 85 25000 1375 121,7 1995 90 22000 1450 126,3 Año 1990: una familia consume 270 litro leche, 100 grs. Azafrán y 150 Kg de carne Según se observa el índice AP (a) posee una formula distinta que el índice de Laspeyres (b), pero generan los mismos resultados.

100 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Índice de precios al consumo (IPC) El IPC se calcula mensualmente por el Instituto Nacional de Estadísticas (INE). Refleja la evolución de los precios para la familia media Española Es un índice de Laspeyres que compara el valor cada mes de un conjunto de artículos con su valor en el período de referencia; éste se denomina Laspeyres encadenado El período de referencia se modifica aproximadamente cada 10 años, para tener en cuenta los cambios en la estructura del consumo de la población española. La distribución de los gastos de las familias (o ponderaciones) se estima realizando una encuesta que se conoce como Encuesta de presupuestos Familiares (EPF) Describe la evolución de los precios de consumo en un país a lo largo del tiempo. El porcentaje de variación o de crecimiento del IPC se puede calcular para cada año, mes, etc, utilizando el índice de precio relativo:

101 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Índice de precios al consumo (IPC) IPC, base Ponderaciones (Fuente INE) Grupos Año 2006, IPC base 2001 Año 2007, IPC base 2006 Alimentos y bebidas no alcohólicas 22,28 22,06 Bebidas alcohólicas y tabaco 3,07 2,82 Vestido y calzado 9,25 9,03 Vivienda 10,71 10,36 Menaje 6,17 6,15 Medicina 2,72 2,83 Transporte 14,91 14,89 Comunicaciones 3,28 3,58 Ocio y cultura 6,78 7,11 Enseñanza 1,68 1,6 Hoteles, cafés y restaurantes 11,45 11,55 Otros bienes y servicios 7,72 8,02 General 100

102 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Números Índice Números índice: permiten describir la evolución de una realidad compleja a lo largo del tiempo. Se emplean en economía y casi todos los campos de las ciencias sociales. 4) Índice de precios al consumo (IPC) Ejemplo del calculo del porcentaje de variación (o crecimiento) año IPC % variación 1987 74,9 - 1988 78,5 4,8 1989 83,9 6,9 1990 89,5 6,7 1991 94,8 5,9 1992 100 5,5 1993 105 5,0 1994 110 1995 115,1 4,6

103 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Probabilidades Contenidos: Conceptos básicos de experimento aleatorio, espacio muestral, suceso, probabilidad, etc. Calculo de probabilidades: reglas básicas, Probabilidad condicionada, regla de Bayes, Independencia Concepto de variable aleatoria. Modelos probabilísticos para variables discretas. Modelos probabilísticos para variables continuas.

104 Principales Conceptos
Introducción a la Estadística Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Principales Conceptos Experimento Aleatorio Espacio Muestral Evento o Suceso Experimento Aleatorio (E) Es cualquier proceso en el cual se recoge información de un fenómeno que presenta variación en sus resultados. Ejemplos: E1: Medir la concentración de gases contaminantes en los tubos de escape de un conjunto de vehículos. E2: Lanzar un dado y observar el Nº sobre la cara superior. E3: Damos una dosis de vitaminas a un niño y observamos el peso y la estatura del niño después de 12 semanas. Espacio Muestral (EM) Es el conjunto de todos los posibles resultados de un Experimento. Ejemplos: EM1: Si x=% de gases contaminantes, los posibles resultados en E1 son EM2: Si x=Nº en la cara superior, los posibles resultados en E2 son EM3: Si x = peso ganado, y =estatura ganada; los posibles resultados en E3 son

105 Introducción a la Estadística Principales Conceptos
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Principales Conceptos Experimento Aleatorio Espacio Muestral Evento o Suceso Evento o Suceso Sea un Experimento (E) y su Espacio Muestral (EM): “un Evento o Suceso es cualquier subconjunto del EM”. A cada uno de los resultados en el EM se le llama Evento Simple o Suceso Elemental. del ejemplo anterior En EM algunos eventos son , En EM algunos eventos son A=“Nº par”, B=“Nº impar”, C=“Nº 4”. En EM algunos eventos son donde B es un evento Simple (suceso elemental)

106 Introducción a la Estadística Sean A y B dos sucesos cualquiera:
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Propiedades Experimento Aleatorio Espacio Muestral Evento o Suceso Sean A y B dos sucesos cualquiera: Se escribe (AB) si ocurre A o si ocurre B o ambos Se escribe (AB) si ocurre A y B AC representa el complemento de A, cuando no ocurre A ocurre AC. Definición 1: Si A y B son eventos, se dice que A y B son excluyentes o mutuamente excluyentes si no pueden ocurrir simultáneamente, es decir, (AB) =. Ejemplos: E: Lanzar un dado y observar el número en la cara superior. EM= {1, 2, 3, 4, 5, 6} A={4}, B=Nº impar={1, 3, 5} (AB) = (A y B son excluyentes) E: Determinar si una persona porta o no un arma blanca. EM= {si, no} A={si}, B={no} (AB) = (A y B son excluyentes)

107 Introducción a la Estadística Sean A y B dos sucesos cualquiera:
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Propiedades Experimento Aleatorio Espacio Muestral Evento o Suceso Sean A y B dos sucesos cualquiera: Se escribe (AB) si ocurre A o si ocurre B o ambos Se escribe (AB) si ocurre A y B AC representa el complemento de A, cuando no ocurre A ocurre AC. Definición 2: Sea E un experimento y EM el espacio muestral, con cada suceso A se asocia un número que medirá la probabilidad de que A ocurra, donde P(A) será la probabilidad de A. Si EM={A1, A2,...,Ar} con s=1, 2,..., r. 0P(Ai)1 P(EM)=1 Si A1,A2,...,Ar son sucesos mutuamente excluyentes, es decir (AiAj) =; la probabilidad de la unión de todos los sucesos es: P(A1)+ P(A2)+... +P(Ar)=

108 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Propiedades 1.- Si  es un conjunto vacío (suceso imposible) la probabilidad es cero: P( )=0 (A  ) =A  P(A  ) = P(A) + P()= P(A) (A  ) = , A y  son sucesos excluyentes 2.- Si A un suceso cualquiera y AC un suceso complementario, EM={A,AC }: P(A) + P(AC) =1 P(A) =1- P(AC) P(AC) =1- P(A) P(EM)=P(A  AC)= P(A) + P(AC) 3.- Sean A y B sucesos cualquiera: P(A  B)= P(A) + P(B)- P(A  B) Si A y B son sucesos independientes: P(A  B)=P(A ) P(B) Si A y B son sucesos excluyentes: P(A B)=  4.- Sean A y B sucesos tales que BA: P(B)P(A) 5.- Sean A, B y C sucesos cualquiera: P(AB C)= P(A) + P(B)+ P(C)- P(AB)- P(A C)- P(B C) + P(A BC)

109 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Definición 3: Sea E un experimento y EM el espacio muestral, A es el suceso de interés, entonces P(A)= (Nº de elementos de A) / (Nº de elementos en EM) Observación: la dificultad en el calculo de la probabilidad está en determinar el Nº de elementos en el espacio muestral. Ejemplo: E: se lanzan 2 dados y se observan los números en las caras superiores. EM= {(1,1) (1,2) (1,3).....(6,6)} A= La suma de los números de las caras superiores es A ={(1,3) (3,1) (2,2)} Problema: Determinar probabilidad de A Nº de elementos en EM= 36 Nº de elementos en A= 3 P(A)=3/36=0,083 (8,3%) Ejercicio: Experimento: lanzar una moneda; Suceso A: que salga cara; calcular P(A). Obtener la frecuencia relativa del suceso A: cuando el experimento se repite 30 veces, 50 veces y 100 veces.

110 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD Ejemplos 1) Una persona tiene 20 lápices en su bolso, 4 de los cuales no funcionan, si tiene que firmar una carta y saca al azar un lápiz del bolso, ¿cuál es la probabilidad de que saque un lápiz bueno?. E: Sacar un lápiz del bolso. EM= {L1, L2, L3, L4, L5, L6, L7, L8, L9, L10, L11, L12, L13, L14, L15, L16, L17, L18, L19, L20} A= Sacar un lápiz bueno. Nº de elementos en EM= 20; Nº de elementos en A= 16; P(A)=16/20= 0,8 (80%) 2) Una bolsa de caramelos de 3 sabores (Sandía, Naranja y Limón) contiene 20 unidades de las cuales el 50% es de Limón, el 25% de Sandía y el otro 25% de Naranja. Si un niño saca al azar un caramelo: a) ¿Cuál el la probabilidad que saque uno de limón? b) ¿Cuál es la probabilidad que saque uno de sandia? c) ¿Cuál es la probabilidad que saque uno de naranja? Si el niño saca al azar dos caramelos: a) ¿Cuál es la probabilidad que los dos sean de limón? b) ¿Cuál es la probabilidad que los dos sean de naranja? c) ¿Cuál es la probabilidad que uno sea de sandía y otro de naranja? En este ejemplo determine: Experimento, Espacio Muestral, Suceso y probabilidad del Suceso

111 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Principio Multiplicativo Permutaciones Combinaciones PROBABILIDAD Técnicas de Conteo “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento” 1.- PRINCIPIO MULTIPLICATIVO - Suponemos un Experimento que consiste en k etapas o procedimientos, donde la etapa ei puede tener ni posibles resultados, i=1,...k. - En el experimento, cada una de las formas de efectuar e1 puede ser seguida por cualquiera de los resultados de e2 y así sucesivamente por cualquiera hasta concretar la última etapa del experimento, que es ek. - Por lo tanto el experimento puede tener (n1 x n2 x … x nk) posibles resultados. Ejemplo: 1) Sea E= se lanza un dado 2 veces: e1= lanzar el dado por primera vez y e2= lanzar el dado por segunda vez. Los posibles resultados en cada etapa del experimento son: n1=6 y n2= 6. El número posible de resultados es: n1n2= 6 6=36.

112 Introducción a la Estadística 1.- PRINCIPIO MULTIPLICATIVO
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Principio Multiplicativo Permutaciones Combinaciones PROBABILIDAD Técnicas de Conteo “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento” 1.- PRINCIPIO MULTIPLICATIVO Ejemplo 2) ¿De cuantas formas se puede vestir una persona que tiene 3 pantalones diferentes, 2 camisas distintas y 2 pares de zapatos?. E= la persona se viste: e1= se pone pantalón, e2= se pone camisa y e3= se pone zapatos . Los posibles resultados en cada etapa del experimento son: n1=3, n2= 2 y n3= 2. El número posible de formas de vestirse es: n1n2 n3 = 3 *2* 2=12.

113 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Principio Multiplicativo Permutaciones Combinaciones PROBABILIDAD Técnicas de Conteo “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento” 2.- PERMUTACIONES y 3) COMBINACIONES PERMUTACIÓN: Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. El Nº de posibles resultados en un experimento es COMBINACIÓN: Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo. donde n!=1x 2 x 3 x … x (n-1) x n por ejemplo 3!= 1x 2 x 3 = 6

114 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 Principio Multiplicativo Permutaciones Combinaciones PROBABILIDAD Técnicas de Conteo “ Permiten determinar el Nº de elementos del Espacio Muestral de un experimento” 2.- PERMUTACIONES y ) COMBINACIONES PERMUTACIÓN: COMBINACIÓN: Ejemplo: Hay cuatro personas (Ana, Rosa, Miguel Claudia) ¿Cuántos grupos se pueden tener mezclando 2 personas? Rpta.: E= de 4 personas formar grupos de 2 EM={AR, AM, AC, RM, RC, MC} A= el grupo esta formado sólo por mujeres P(A)= 3/6=0,5 B= el grupo es mixto P(B)=3/6=0,5 Ejemplo: Se tienen 4 banderas (Roja, Amarilla, Verde Blanca) ¿Cuántas señales se pueden tener mezclando 2 banderas? Rpta.: E= de 4 banderas sacar dos banderas y formar señales EM={RA, AR, RV, VR, RB, BR, AV, VA, AB, BA, VB, BV} A= la señal tiene una bandera Roja P(A)= 6/12=0,5

115 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD PROBABILIDAD CONDICIONADA La idea de probabilidad condicionada permite incorporar información relevante para hallar la probabilidad de un suceso. La expresión de la probabilidad condicionada es la siguiente: sabiendo que es decir, los dos sucesos ocurren al mismo tiempo Ejemplo: En una población de N mujeres y hombres, donde NM son mujeres y NH son hombres, se sabe que Nc consumen cierto producto, de los cuales NcM mujeres consumen ese producto. Experimento: se elige al azar una persona y se le pregunta si consume el producto. A: la persona consume el producto. Si sabemos que la persona seleccionada es mujer, la probabilidad de que consuma el producto condicionada a que es mujer se obtiene como sigue: A: la persona consume el producto; B: la persona es mujer. Esquemáticamente: E A B

116 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD REGLA DE BAYES En algunos casos, el espacio muestral de un Experimento se puede partir en varios sucesos, los llamaremos B1, B2, …, Br, incompatibles entre si o excluyentes (no hay intersección), tal como se presenta en el esquema: En ese mismo experimento existe un suceso A cualquiera de nuestro interés, representado en el siguiente esquema: La probabilidad del suceso A puede calcularse a partir de las probabilidades de A condicionado por los diferentes sucesos B1, B2, …, Br, utilizando la formula de probabilidad total: Sobre la base de la formula anterior, se puede calcular la probabilidad de que ocurra el suceso Bi (i=1,2,…,r) dado el suceso A mediante la formula:

117 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD REGLA DE BAYES La probabilidad del suceso A: La Prob. que ocurra el sucesoBi (i=1,2,…,r) dado el suceso A: Ejemplo: Estudio de la situación laboral de los trabajadores en 4 sectores de la economía, denotados por B1, B2, B3 y B4. a) Interesa determinar la probabilidad que una persona este en paro y b) de que una persona que esta sin trabajo pertenezca al segundo sector Sea el suceso A: estar sin trabajo (estar en paro) La probabilidad de que una persona este sin trabajo en el sector B1 es P(A/B1)=0,05 - La probabilidad de que una persona este sin trabajo en el sector B2 es P(A/B2)=0,01 - La probabilidad de que una persona este sin trabajo en el sector B3 es P(A/B3)=0,02 La probabilidad de que una persona este sin trabajo en el sector B4 es P(A/B4)=0,1 Se sabe que la mitad de las personas pertenecen al primer sector y y el resto se divide en partes iguales entre los otros 3, por lo tanto: La probabilidad de que una persona proceda del sector B1 es P(B1)=0,5 - La probabilidad de que una persona proceda de los sectores B2, B3 y B4 es P(B2) = P(B3) = P(B4) = 0,16 a) La probabilidad que una persona este en paro es: b) La probabilidad que una persona que está sin trabajo pertenezca al sector 2 (B2) es:

118 Introducción a la Estadística
Licenciatura en administración y dirección de Empresas (LADE) UC3M-2007 PROBABILIDAD INDEPENDENCIA Dos sucesos son independientes cuando la aparición de uno de ellos no modifica la probabilidad de que ocurra el otro. Por lo tanto, dos sucesos A y B son independientes si: Si A y B son independientes, entonces: Ejemplo a: no hay independencia entre los sucesos A y B Experimento: se lanza dos veces un dado equilibrado. El suceso A: en el segundo lanzamiento sale un Nº par. El suceso B: La suma de los resultados es al menos 9 Los elementos de A son {12, 22, 32, 42, 52, 62,14, 24, 34, 44, 54, 64, 16, 26, 36, 46, 56, 66} Los elementos de B son { 63, 36, 54, 45, 64, 46, 56, 65, 66, 55} Los elementos de A y B son {54, 64, 36, 46, 56, 66} Por lo tanto: , y Ejemplo b: hay independencia entre los sucesos A y B Experimento: se lanza dos veces una moneda equilibrada donde {CC, CX, XC, XX} El suceso A: en primer lanzamiento sale cara A={CC, CX}. El suceso B en el segundo sale cara, B={XC,CC}. Que resulte A y B es {CC}. La P(A)=2/4=0,5 y P(B)=2/4=0,5 y P(AyB)=1/4=0, por lo tanto P(AyB)=P(A)xP(B)=0,5 x 0,5 = 0,25

119


Descargar ppt "Introducción a la Estadística"

Presentaciones similares


Anuncios Google