Unidad I Ordenamiento de la Información

Slides:



Advertisements
Presentaciones similares
SIES – SISTEMA INTEGRADO DE EDUCACIÓN SUPERIOR
Advertisements

Curso: Seminario de estadística Aplicada a la investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio.
Programa Académico de Maestría en Educación para Docentes de la Región Callao ESTADISTICA PARA LA INVESTIGACIÓN PSICOPEDAGÓGICA II José Luis Morón Octubre.
Exp. Renán Quispe LLanos
JUAN JOSÉ VENEGAS MORENO
La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
1 LA UTILIZACION DE LAS TIC EN LAS MICROEMPRESAS GALLEGAS. AÑO mayo 2005.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
1 INFORME RESUMEN SOBRE EL NIVEL DE UTILIZACION DE LAS TIC EN LAS EMPRESAS GALLEGAS ( Resumen PYMES ) Noviembre de 2004.
TEMA 2 MÚLTIPLOS Y DIVISORES
Respuestas Buscando a Nemo.
ABECEDARIO FIGURAS GEOMÉTRICAS NÚMERO
Décima sexta clase, Medidas de Dispersión
Lic. Cristian R. Arroyo López
JUAN JOSÉ VENEGAS MORENO
Medidas de centralización para datos no agrupados
Descripción de los datos: medidas de ubicación
Descripción de los datos: medidas de dispersión
Medidas de Posición Central:
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
MÉTODOS ESTADÍSTICOS.
Capítulo 4 Otras medidas descriptivas
Capítulo 3 Descripción de datos, medidas de tendencia central
Estadística Administrativa I
Capítulo 3: Medidas de posición
ESTADISTICA I Medidas de tendencias centrales
Parámetros estadísticos
Administración de la seguridad I
EL OSO APRENDIZ Y SUS AMIGOS
Ecuaciones Cuadráticas
CLASE 1: Recordando algunos conceptos previos de Estadística
RAZONAMIENTO MATEMATICO Mg. CORNELIO GONZALES TORRES
MEDIDAS DE DISPERSIÓN.
FRANCISCO JAVIER RODRÍGUEZ
¿Qué es un conjunto? Un conjunto es una colección de objetos considerada como un todo. Los objetos de un conjunto son llamados elementos o miembros del.
Curso de Hidrología Caudales Máximos II
ESTADÍSTICA UNIDIMENSIONAL
SUCESIONES Y PROGRESIONES.
MATEMÁTICAS 2º ESO UD8 ESTADÍSTICA.
ESTADIGRAFOS DE DISPERSION
Conceptos Básicos y Estadística Descriptiva
estadistica Corporación Unificada Nacional Modalidad: Distancia
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
Estadística Administrativa I
ESTADISTICA 3 ro. SECUNDARIA.
La Estadística se encarga de dar solución a este y otros problemas.
GRUPO I ESTADISTICA I YIRA LOPEZ WILLIAM ESTEVEZ CAROLINA PEREZ
ESTADÍSTICA 2ºESO Mariano Benito.
Tema 2: Parámetros Estadísticos
ESTADÍSTICAS DESCRIPTIVA
TABLAS DE FRECUENCIAS Una vez recopilados, tendremos un conjunto de datos que será necesario organizar para extraer información. Lo primero que se hace.
Page 1 ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO FACULTAD DE INFORMATICA Y ELECTRONICA ESCUELA DE DISEÑO GRAFICO ESTADISTICA TEMA: estadista, entendimiento.
MEDIDAS DE DISPERSIÓN. La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la confiabilidad de.
ESTADÍSTICA.
2.2: Resumen numérico Medidas de localización. Medidas de dispersión.
Estadística Al hacer Un sondeo de opinión
Historia de la Estadística
Tablas de estadística.
ESTADÍSTICA UNIDIMENSIONAL
Objetivo: Recordar elementos presentes en el estudio de la estadística
DATOS ESTADÍSTICOS.
Gráficos.
Estadística descriptiva
CONCEPTOS BÁSICOS, TABULACIÓN, GRÁFICOS
LOGO Medidas de posición Pedro Godoy G. Media Aritmética Valor representativo de un conjunto de datos Para datos no agrupados 1, x2, x3, x4,…………………………,
Medidas de tendencia central
Estadística y probabilidad
Transcripción de la presentación:

Unidad I Ordenamiento de la Información Probabilidad Unidad I Ordenamiento de la Información

Captura de datos muestrales

Conceptos básicos de la estadística Población (o universo): Totalidad de elementos o cosas bajo consideración Muestra: Es una parte de la población seleccionada para el análisis. Parámetro: Es una medida numérica que describe una característica de la población Estadístico: Es la medida numérica que describe alguna característica de la muestra

Tipos de Muestras Tipos de muestras usadas Muestras no probabilísticas Muestra de juicio Muestra de cuota De parte Grande Muestras de probabilidad Muestra Aleatoria simple Muestra sistemática Muestra estratificada Muestra de agrupación

Recolección de Datos Proporcionados por una organización o un individuo. El diseño de un Experimento Una encuesta Un estudio observacional

Tipos de Datos Tipo de Dato Tipo de Preguntas Respuestas Categórico ¿Posee actualmente algunas acciones o bonos? Si | No ¿A cuántas revistas está Suscrito actualmente? Discreto ______ Número Numérico Continuo ¿Cuánto mide? ______ Metros

Diseño del cuestionario Propósito: Recabar información significativa que nos ayude en el proceso de toma de decisiones. Formular preguntas cortas, libres de ambiguedades. ¿Fuma Usted? ____ Si ____No ¿Cuántos Años tiene? ____ (en años) Pruebas piloto

Elección de la muestra Para seleccionar la muestra pueden usarse 2 métodos básicos: Con remplazo Sin remplazo Uso de tabla de números aleatorios

Organización de los datos numéricos Arreglo Ordenado Diagrama de tallo y hojas

Distribución de frecuencias Es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente.

Tipos de frecuencias Frecuencia absoluta La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Tipos de frecuencias Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1.

Tipos de frecuencias Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. xi Recuento fi Fi ni Ni

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29 xi Recuento fi Fi ni Ni 27 I 1 0.032 28 II 2 3 0.065 0.097 29 IIIII I 6 9 0.194 0.290 30 IIIII II 7 16 0.226 0.0516 31 IIIII III 8 24 0.258 0.774 32 III 0.871 33 0.968 34   Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de frecuencias agrupadas La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo elintervalo para el cálculo de algunos parámetros.

Construcción de una tabla de frecuencias agrupadas 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. 2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer. Es conveniente que el número de intervalos oscile entre 5 y 15. En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10 intervalos. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.   ci fi Fi ni Ni [0, 5) 2.5 1 0.025 [5, 10) 7.5 2 0.050 [10, 15) 12.5 3 5 0.075 0.125 [15, 20) 17.5 8 0.200 [20, 25) 22.5 11 0.2775 [25, 30) 27.5 6 17 0.150 0.425 [30, 35) 32.5 7 24 0.175 0.600 [35, 40) 37.5 10 34 0.250 0.850 [40, 45) 42.5 4 38 0.100 0.950 [45, 50) 47.5 40

Ejercicios  Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribución de frecuencias

El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribución de frecuencia

Los pesos de 65 Empleados de una fabrica [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) fi 8 10 16 14 5 2

Definición de parámetro estadístico Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Tipos de parámetros estadísticos Hay tres tipos parámetros estadísticos: De centralización. De posición De dispersión.

Medidas de Centralización Nos indican en torno a qué valor (centro) se distribuyen los datos. Media aritmética La media es el valor promedio de la distribución. Mediana La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que más se repite en una distribución.

Medidas de posición Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. La medidas de posición son: Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión Rango o recorrido Desviación media Varianza El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística. Desviación media La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Desviación típica La desviación típica es la raíz cuadrada de la varianza.

Trabajo Parcial 1 Fecha de entrega: 10 Septiembre de 2010 Encuestar a 50 estudiantes de la escuela de sistemas sobre Cultura y Deporte Elaborar la Distribución de frecuencias para cada una de las preguntas Para Cada distribución calcular los parámetros estadísticos de centralización y de dispersión Graficar los resultados de las distribuciones. Minimo de preguntas para la encuesta: 7 Incluir evidencias de encuesta!!!!!

Moda La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Moda Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución esbimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Moda (datos agrupados) Li es el límite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi-1 es la frecuencia absoluta inmediatamente inferior a la clase modal. fi+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase.

Moda También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

Ejemplo (Moda) Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

Ejemplo (Moda)

Mediana Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas.

Calculo de la Mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5

Calculo para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre . Li es el límite inferior de la clase donde se encuentra la mediana. fi es la frecuencia absoluta. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.

Ejemplo (Mediana)

Media aritmética La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.  es el símbolo de la media aritmética.

Media aritmética para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

Ejercicio (Media Aritmética) En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.

Los pesos de 65 Empleados de una fabrica [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) fi 8 10 16 14 5 2 Encontrar para datos agrupados Me, Mo ,

Cuartiles Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .

Cálculo de Cuartiles

Cuartiles para datos agrupados En primer lugar buscamos la clase donde se encuentra  , en la tabla de las frecuencias acumuladas. Li es el límite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase

Ejercicio