Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Fundamentos Aplicaciones Prácticas
ESTADÍSTICA APLICADA Fundamentos Aplicaciones Prácticas
2
1. TERMINOLOGIA básica POBLACION ESTUDIO: Conjunto de todos los elementos que serán observados, estudiados y seleccionados como muestra para la investigación. En la Población estudio se reconocen los siguientes factores: Elemento Unidad Muestral Alcance Tiempo Variable Marco Muestral
3
Ej: Detergente marca Ariel Presentaciones: Granulado , Barra, Liquido
ELEMENTO: Es quien se observa , se mide o a quien corresponde la información. Ej: Detergente marca Ariel Presentaciones: Granulado , Barra, Liquido UNIDAD MUESTRAL: Colección de elementos con características homogéneas. Ej: Supermercados, Bodegas, Despensas, Tiendas, Fabricas, Hogares.
4
ALCANCE: Área o espacio geográfico que abarca la investigación.
Ej: Bucaramanga, Área Metropolitana de B/manga, Departamento, Barrio, etc. TIEMPO: Época o fecha en la que se realiza la investigación. Ej: Mayo de 2010 VARIABLE: Lo que se va a estudiar del elemento. Ej: Ventas (Unidades, Pesos, Gramos).
5
MARCO MUESTRAL: Listado de unidades muestrales que conforman la población estudio.
Ej: Listado de Supermercados de Bucaramanga y su Área Metropolitana. ¡¡¡ EN RESUMEN !!! POBLACION ESTUDIO: Monitorear las ventas del detergente marca Ariel, presentación granulada con suavizante de 500 gramos en los supermercados de Bucaramanga durante el mes de Mayo de 2010.
6
TÉCNICAS de muestreo
7
TÉCNICAS de muestreo Son utilizadas para seleccionar una muestra representativa de la Población Estudio. Una vez elegida la muestra se procede a aplicar el respectivo estudio, por ejemplo: Ventas en gramos del detergente Ariel. Tipos de religión que profesan y practican los estudiantes de Tecnología en Administración Empresarial.
8
Se estudiarán tres tipos de Muestreo:
Muestreo Aleatorio Simple (MAS) Muestreo Sistemático Muestreo Estratificado Para ejemplificar cada uno de ellos se tomará una población de 39 estudiantes con sus respectivos nombres, que se supondrán en este caso.
9
Randómico en la calculadora:
MUESTREO ALEATORIO SIMPLE (MAS) Identificar la Población Estudio: N = 39 Determinar el tamaño de la muestra: n = 5 Efectuar una selección aleatoria de la muestra con Números Randómicos. Randómico en la calculadora: SHIFT / Ran # / = 4. Tomar cada uno de los 5 Randómicos y multiplicarlos por N para obtener los estudiantes que conformarán la muestra.
10
Ej: (N) * ( Ran #) = Posición del
Estudiante en la lista. (39) * (0,257) = 10,023 = 10 Adrian (39) * (0,928) = 36,192 = 36 Jorge (39) * (0,342) = 13,338 = 13 Clara (39) * (0,944) = 36,816 = 37 Patricia (39) * (0,731) = 28,5 = 29 Andrés De esta forma ya hemos obtenido la muestra representativa para realizar el estudio y corresponde a los alumnos con códigos 10,36,13, 37 y 29 en la lista.
11
MUESTREO SISTEMÁTICO Identificar la Población Estudio: N = 39 Determinar el tamaño de la Muestra: n = 5 Determinar la Constante Sistemática de Selección K mediante la formula: K ≤ N/n K ≤ 39 /5 ≤ 7,8 ≤ 7 K = 7
12
4. Determinar el primer elemento multiplicando un numero randómico por K, es decir:
(0,618) * (7) = 4, 326 = 4 Juliana 5. Determinar los otros cuatro elementos tomando el inicial y sumándole la constante: 4 + 7 = Pedro = 18 Lucia = 25 Rafael = 32 Catalina
13
MUESTREO ESTRATIFICADO
1. Identificar la Población Estudio: N = 39 2. Identificar los estratos Ni y el tamaño de c/u. Ej: Nm = Mujer = 28 en el salón Nh = Hombre = 11 en el salón 3. Determinar el tamaño de la Muestra: n = 5 4.Establecer la asignación proporcional o determinar los ni mediante la expresión: ni = n (Ni / N) nm = 5 (28 / 39) = 3,58 = 4 nh = 5 (11 / 39) = 1,41 = 1 39 en total
14
De esta forma se sabe que deben seleccionarse 4 mujeres y 1 hombre, para completar la muestra representativa. Pueden ser elegidos aleatoriamente o mediante MAS. N = 39 Nm = 28 Nh = 11 nm = 4 nh = 1 ÁRBOL DE RESULTADOS
15
Medidas de tendencia central
16
Ejercicio prÁctico NUMERO PESO (Kg) 1 56 2 86 3 75 4 48 5 58 6 90 7 78 8 55 9 10 62 11 12 13 14 74 15 Se tiene una muestra de 15 estudiantes de Tecnología en Administración Empresarial del SENA con sus respectivos pesos (kg). Los datos se muestran en la siguiente tabla.
17
MEDIA: Es un valor comprendido entre el dato mayor y el dato menor.
X = media ∑ = sumatoria de cada uno de los elementos Xi = observaciones o elementos n = número de observaciones o elementos
18
De este modo tenemos: X=( ) 15 X = 64,93 Kg En promedio, los estudiantes del curso pesan 64,93 kg (aproximadamente 65 kg).
19
MEDIANA (Me): Es el valor de la variable estudio que divide en dos partes proporcionalmente iguales a la distribución de los datos, ordenados de mayor a menor o viceversa. Procedimiento: Ordenar los datos de menor a mayor o viceversa. 2. Identificar el valor de n donde:
20
a. Si n es impar la mediana corresponde al valor de la variable que ocupa la posición dada por:
En nuestro caso se tiene n impar con valor de 15, por tanto la mediana será el valor que se encuentre en la posición: (15+1) /2 = 16/2 = 8
21
En la lista de datos ordenados observamos que
esta posición corresponde a 62 kg: Esto indica que aproximadamente el 50 % de los datos se consideran menores o iguales a dicho valor y el otro 50% mayores al mismo. b. Si n es par, la mediana corresponde al promedio de las observaciones que ocupan las posiciones (n/2) y (n/2 +1).
22
Me = ( ) / 2 = 60 kg MODA (Mo): Es la observación o el dato que presenta la mayor frecuencia (el que mas se repite). En nuestro caso la moda es 48kg .
23
TIPOS DE DISTRIBUCIÓN DE LOS DATOS
24
TIPOS DE DISTRIBUCIÓN DE LOS DATOS
DISTRIBUCIÓN DE FRECUENCIAS Es un agrupamiento de datos en categorías, que muestra el número de observaciones en cada una de ellas. Usualmente se presenta en forma de Histogramas, Polígonos de Frecuencias, Gráfica de Pastel y Gráficos de líneas. HISTOGRAMA: Gráfica en la que las categorías se indican en el eje horizontal y las frecuencias de las categorías en el eje vertical. Las frecuencia se representa por la atura de las barras.
25
Ej: Se tiene el siguiente grupo de datos que corresponde a las edades de los 37 funcionarios de un banco. Construir un Histograma para visualizar las categorías y la frecuencia de cada una de ellas. 22, 24, 45, 55, 57, 33, 35, 36, 20, 21, 30, 41, 45, 47, 28, 39, 56, 50, 56, 41, 32, 33, 21, 29, 29, 46, 49, 40, 23, 23, 26, 28, 53, 34, 30, 25, 60. Se observa que las edades de los funcionarios del Banco se encuentran entre los 20 y los 60 años. Por lo tanto podemos construir las siguientes categorías e identificar la frecuencia de las observaciones en cada una de ellas.
26
EDAD DE LOS FUNCIONARIOS DE UN BANCO
CATEGORIA FRECUENCIA Entre 20 y 30 años 15 Entre 31 y 40 años 8 Entre 41 y 50 años Entre 51 y 60 años 6 TOTAL 37
27
El histograma se obtiene graficando las categorías en el eje horizontal y las frecuencias en el eje vertical, manualmente o con la ayuda de programas como Excel.
28
Con el diagrama de pastel se puede visualizar la distribución en forma de porcentajes.
29
Otra forma de presentar la distribución de frecuencias es mediante las Campanas de Gauss.
Con el uso de las medidas de tendencia central (media, mediana y moda) obtenemos los siguientes tipos de gráficos bajo ciertos parámetros:
30
DISTRIBUCIÓN ASIMÉTRICA POSITIVA O SESGADA A LA DERECHA
Se presenta cuando: Media › Mediana › Moda X › Me › Mo CATEGORIA FRECUENCIA 1 2 3 5 4 6 7
31
DISTRIBUCIÓN SIMÉTRICA O NORMAL
Se presenta cuando: Media ≈ Mediana ≈ Moda X ≈ Me ≈ Mo CATEGORIA FRECUENCIA 1 2 3 5 4 6 7
32
DISTRIBUCIÓN ASIMÉTRICA NEGATIVA O SESGADA A LA IZQUIERDA
Se presenta cuando: Media ‹ Mediana ‹ Moda X ‹ Me ‹ Mo CATEGORIA FRECUENCIA 1 2 3 4 6 5 7
33
MEDIDAS DE DISPERSIÓN O VARIACIÓN
34
Rango = Valor Mayor – Valor Menor
MEDIDAS DE DISPERSIÓN Medidas como la media y la mediana no nos dan información de la dispersión o la variación de los datos, por lo tanto es necesario definir otras medidas como: RANGO: Es la diferencia entre el mayor valor y el menor valor. Rango = Valor Mayor – Valor Menor
35
Ej: La producción máxima de computadores en la Planta Facilitos S
Ej: La producción máxima de computadores en la Planta Facilitos S.A es de 52 y la mínima es de 48; por lo tanto el rango de la producción diaria es de: Rango = 52 – 48 = 4 Por el contrario en la planta Exitosos S.A la producción máxima es 60 y la producción mínima es 40 por tanto el rango es: Rango = 60 – 40 = 20 Conclusión 1: hay menos dispersión en la producción diaria de la planta Facilitos S.A que en la planta Exitosos S.A.
36
Esto indica que la planta Facilitos es mucho mas eficiente y productiva que la planta Exitosos.
Conclusión 2: la producción esta mas estrechamente agrupada alrededor de 50 computadoras por día en la planta Facilitos que en la planta Exitosos, lo que nos indica nuevamente un mejor desempeño de la primera empresa. VARIANZA POBLACIONAL: Es la media aritmética de las desviaciones de la media elevadas al cuadrado. Se usa para comparar la dispersión de dos o mas grupos de datos.
37
¿Cuál es la Varianza Poblacional?
Ej: Las edades de todos los pacientes en la sala de aislamiento de la clínica La Merced son 38, 26, 13, 41 y 22 años. ¿Cuál es la Varianza Poblacional? Varianza Poblacional = σ2 = ∑ (X- μ) 2 / N σ2 = Varianza Poblacional X = valor de una observación de la población μ = media aritmética de la población N = número de observaciones de la población
38
Por tanto tenemos: EDAD (años) X - μ (X - μ)2 38 10 100 26 -2 4 13 -15
225 41 169 22 -6 36 140 534
39
μ = (∑ X)/ N = 140 /5 μ = 28 σ2 = ∑ (X- μ) 2 / N = 534 /5 σ2 = 106.8
σ2 = 106.8 La varianza de las edades de los pacientes es de Si la varianza en las edades de los pacientes de cáncer en el hospital es de se puede decir:
40
1. Hay menos dispersión en la distribución de las edades de los pacientes en aislamiento que en la distribución de las edades de los pacientes de cáncer porque es menor que 2. Las edades de los pacientes en aislamiento están mas estrechamente agrupadas alrededor de la media de 28 años de lo que lo están las de los pacientes en la sala de cáncer.
41
DESVIACION ESTANDAR POBLACIONAL:
Es la raíz cuadrada positiva de la varianza poblacional. Representa un promedio de cuanto se separan todos los datos de la media y viene dada por la formula: σ = √ {∑ (X- μ) 2 / N} Por tanto la desviación estándar de las edades de los pacientes de la sala de aislamiento de el anterior ejemplo es:
42
σ = √σ2 = √106.8 = 10.3 años σ = 10.3 años Lo anterior indica que en promedio cada una de las edades de los pacientes se alejan 10.3 años de la media que es de 28 años.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.