Estadística I. Finanzas y contabilidad

Slides:



Advertisements
Presentaciones similares
Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
Advertisements

Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
MEDIDAS DE TENDENCIA CENTRAL
La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
Estadística I. Finanzas Y Contabilidad
ANALISIS DE DATOS CUANTITATIVOS
UNIVERSIDAD NACIONAL DE EDUCACIÓN
Lic. Cristian R. Arroyo López
Lic. Cristian R. Arroyo López
MEDIDAS DE TENDENCIA CENTRAL
Medidas de centralización para datos no agrupados
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Capítulo 4: Medidas de dispersión
Capítulo 3: Medidas de posición
TEMA 2.3. MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL A.7.1.
Parámetros estadísticos
DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
ESTADÍSTICA DESCRIPTIVA
Introducción Estadística ¿Qué es la estadística?
ESTADÍSTICA UNIDIMENSIONAL
Medidas de Dispersión Estadística E.S.O.
ESTADIGRAFOS DE DISPERSION
Mg. LIC. ANANI BASALDUA GALARZA
Medidas Descriptivas Numéricas
MEDIDAS DE TENDENCIA CENTRAL
ANALISIS DE DATOS CON EXCEL
REPASO BLOQUE I: TEMAS 1-4
DEPARTAMENTO DE MATEMÁTICA APLICADA
La Estadística se encarga de dar solución a este y otros problemas.
Estadística Descriptiva continuación
Tema 2: Parámetros Estadísticos
Medidas de resumen.
Laboratorio de Estadística administrativa
Medidas de Posición y Centralización Estadística E.S.O.
Tratamiento de datos y azar
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
Analisis exploratorio INGRID TATIANA RODRIGUEZ GUZMAN DIANA COSTANZA BERMUDEZ GORDILLO.
ESTADÍSTICA.
ESTADISTICA PARA RELACIONES LABORALES
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
2.2: Resumen numérico Medidas de localización. Medidas de dispersión.
Describir una variable numérica
Bioestadística Tema 2: Estadísticos Bioestadística. U. Málaga.
Estadística Aplicada a la Sesión 04: Medidas de Posición
ANÁLISIS E INTREPRETACIÓN DE DATOS
PARÁMETROS ESTADÍSTICOS
Estadística Básica Conceptos & Aplicaciones
Sesión 8 Tema: Estadística descriptiva Objetivo:
ESTADÍSTICA UNIDIMENSIONAL
MEDIA, MEDIANA Y MODA DE DATOS AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL
Medidas de tendencia central
Características de las distribuciones estadísticas
Gráficos.
Estadística descriptiva
Estadística descriptiva
Estadística y probabilidad aplicada a los negocios
Medidas de tendencia central
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad.
Transcripción de la presentación:

Estadística I. Finanzas y contabilidad Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad. Modelos probabilísticos. Introducción a la inferencia estadística. Contrastes de hipótesis.

Tema 2: Análisis de datos univariantes Representaciones y gráficos. Tablas de frecuencias. Diagrama de barras, Pictogramas, Histograma, Polígono de frecuencias, y Diagrama de caja. Resumen numérico. Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997)

Tema 2: Análisis de datos univariantes Medidas de localización o posición Moda Mediana Media Cuantiles Diagrama de caja Medidas de dispersión Varianza y desviación típica Coeficiente de variación Rango y rango intercuartílico Lecturas recomendadas: Capítulos 4 y 5 del libro de Peña y Romo (1997)

MEDIDAS DESCRIPTIVAS Medidas de localización o posición ¿Para qué nos sirven? ¿Se pueden calcular todas con todo tipo de variables? ¿Cuáles son las más adecuadas en cada caso? ¿De qué forma podemos sacar partido a nuestra calculadora?

Medidas de localización o posición LA MODA: (Cuando los datos no están agrupados en intervalos) Es el valor que aparece con una frecuencia mayor. Puede haber más de una moda: bimodal-trimodal-plurimodal 7 7 7 5 3 5 11 7 11 2 11 7 4 8 8 7 10 2 5 ¿Qué valor toma la moda?

Medidas de localización o posición Clases ni Marca de clase [0,5) 11   [5,10) 13 [10,15) 6 [15,20) 2 [20,25) 1 [25,30) 3 LA MODA: (Cuando los datos están agrupados en intervalos) Podemos encontrar: La CLASE MODAL ¿En la representación gráfica? Pero, ¿y si queremos calcular “exactamente” el valor de la MODA? ¿Podemos calcularla para DATOS CUALITATIVOS?

Medidas de localización o posición EJERCICIO: LA MODA Intervalo Frecuencia absoluta [0,5) 6 [5,10) 14 [10,15) 20 [15,20) 10 Calcular el valor “exacto” de la moda.

Medidas de localización o posición LA MEDIANA: (Cuando los datos no están agrupados en intervalos) Es la observación que ocupa el “lugar” central 7 7 7 5 3 5 11 7 11 2 11 7 4 8 8 7 10 2 5 ¿Qué valor toma la mediana? Ordenamos los datos de menor a mayor. Tenemos en cuenta también los que se repiten. La mediana, es el “CENTRO FÍSICO” ¿Cómo cambia el cálculo si N es par o impar?

Medidas de localización o posición LA MEDIANA: (Cuando los datos están agrupados en intervalos) Clases ni Marca de clase [0,5) 13 2,5 [5,10) 11 7,5 [10,15) 6 12,5 [15,20) 2 17,5 [20,25) 1 22,5 [25,30) 3 27,5 Podemos encontrar: El INTERVALO MEDIANO Pero, ¿y si queremos calcular exactamente el valor de la MEDIANA? ¿Podemos calcularla para DATOS CUALITATIVOS?

Medidas de localización o posición (Cuando los datos no están agrupados en intervalos) LA MEDIA ARITMÉTICA: Es el PROMEDIO de los valores de la muestra 7 7 7 5 3 5 11 7 11 2 11 7 4 8 8 7 10 2 5 ¿Qué valor toma la media? Sumamos los datos. Los dividimos por el número total de datos (N).

Medidas de localización o posición (Cuando los datos están agrupados en intervalos) LA MEDIA ARITMÉTICA: Clases ni M.C. (xi) ni xi [0,5) 13 2,5 32,5 [5,10) 11 7,5 82,5 [10,15) 6 12,5 75 [15,20) 2 17,5 35 [20,25) 1 22,5 [25,30) 3 27,5 330 Suma 9,17 Media El valor de la media con los datos agrupados en intervalos utiliza la marca de clase. ¿Podemos calcularla para DATOS CUALITATIVOS?

Medidas de localización o posición (Cuando los datos están agrupados en intervalos) La MEDIA ARITMÉTICA para datos agrupados en intervalos es entonces:

Medidas de localización o posición LOS CUANTILES: (Cuando los datos no están agrupados en intervalos) Nos divide en conjunto de datos en k partes. Si por EJEMPLO tenemos diez datos (N=10), y queremos hacer cuatro partes (k=4), necesitamos tres marcas (c1, c2 y c3) Cuando k=4, se llaman CUARTILES; cuando k=10, DECILES; y cuando k=100, CENTILES.

Medidas de localización o posición CÁLCULO DE CUARTILES Tenemos el siguiente conjunto de datos: 47 52 52 57 63 64 69 71 72 72 78 81 81 86 91 Ordenamos los datos de menor a mayor. Calculamos c2 , que ocupa la posición correspondiente a la “mitad”, ¿con qué parámetro visto ya coincide este segundo cuartil? Ahora calculamos, la “mitad” de la primera parte: c1 . Y la “mitad” de la segunda parte: c3

Medidas de localización o posición 47 52 57 63 64 69 71 72 78 81 86 91 c1 = 60 c2 = 71 c3 = 79,5

REPRESENTACIÓN GRÁFICA UTILIZANDO LOS CUARTILES Diagrama de caja REPRESENTACIÓN GRÁFICA UTILIZANDO LOS CUARTILES Utilizando el anterior conjunto de datos: Los cálculos: Primer cuartil: 60 Segundo cuartil: 71 Tercer cuartil: 79,5 Media aritmética: 69,07 2. Hay datos que pueden provenir de observaciones “mal tomadas”: datos atípicos. Para detectarlas, calculamos: LI=c1-1,5(c3-c1) LS=c3+1,5(c3-c1)

Diagrama de caja EJERCICIO 1: DIAGRAMA DE CAJA 56 59 59 61 67 56 59 59 61 67 69 73 76 76 80 83 83 84 90 94 Construir el diagrama de caja para el anterior conjunto de datos.

Diagrama de caja EJERCICIO 2: DIAGRAMA DE CAJA 35 45 45 55 57 62 64 64 35 45 45 55 57 62 64 64 64 65 73 74 74 76 78 80 82 84 86 92 92 92 93 94 97 112 116 116 123 123 124 128 140 143 173 214 255 277 Construir el diagrama de caja para el anterior conjunto de datos.

Tema 2: Análisis de datos univariantes Medidas de localización o posición Moda Mediana Media Cuantiles Diagrama de caja Medidas de dispersión Varianza y desviación típica Coeficiente de variación Rango y rango intercuartílico

Medidas de dispersión: Varianza PRIMER CONJUNTO DE DATOS (Salarios anuales en € de la empresa A) 30700 32500 32900 33800 34100 34500 36000 SEGUNDO CONJUNTO DE DATOS (Salarios anuales en € de la empresa B) 27500 31600 31700 33800 35300 34000 40600 Vamos a calcular: MEDIA y MEDIANA de ambos conjuntos de datos: Observa ahora las representaciones gráficas. Señala media y mediana. ¿Tenemos suficiente información?

Medidas de dispersión: Varianza Parece que la diferencia entre ambos conjuntos de datos son las DISTANCIAS A LA MEDIA, vamos a calcularlas. Empresa A xi- Empresa B 30700 -2800 27500 -6000 32500 -1000 31600 -1900 32900 -600 31700 -1800 33800 300 34100 600 34000 500 34500 1000 35300 1800 36000 2500 40600 7100 ¿Cuánto suman nuestras dos nuevas columnas? NUEVA PROPIEDAD: ¿Por qué sucede esto? ¿Podemos solucionarlo de alguna manera?

¿Qué indica este nuevo parámetro? Medidas de dispersión: Varianza Modificamos nuestro cálculo: Empresa A   Empresa B 30700 7840000 27500 36000000 32500 1000000 31600 3610000 32900 360000 31700 3240000 33800 90000 34100 34000 34500 35300 250000 36000 6250000 40600 50410000 16900000 96840000 ¿Qué hacemos para poder compararlas? ¿Qué indica este nuevo parámetro? ¿Qué unidades tiene este nuevo parámetro? ¿Podemos cambiarlas?

Medidas de dispersión: Coeficiente de variación Cuando la media sea distinta de “0”, podemos calcular: Nos permite comparar, porque no tiene unidades. ¿Para qué nos sirve con una única base de datos? EJERCICIO 3: Analizamos el volumen de consultas durante el período de exámenes en 10 bibliotecas universitarias, y se comparan con las anotadas el año anterior. El % de incremento de consultas fue: 10.2 2.9 3.1 6.8 5.9 7.3 7.0 8.2 3.7 4.3 ¿Son los datos homogéneos?

Medidas de dispersión: Rango y rango intercuartílico Rango: la diferencia entre el mayor y el menor de los datos. Rango intercuartílico: la diferencia entre el tercer y el primer cuartil. Rango intercuartílico Rango EJERCICIO 4: Calcula estas dos medidas para los EJERCICIOS 1 y 2.