La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.

Presentaciones similares


Presentación del tema: "Estadística Descriptiva: 1. Muestreo y Presentación de los Datos."— Transcripción de la presentación:

1 Estadística Descriptiva: 1. Muestreo y Presentación de los Datos.
Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

2 Estadística: Dos conceptos fundamentales: muestra y población
Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones Muestra: subconjunto de la población que se extrae para ser estudiado

3 Estadística: ¿Porqué una muestra?
Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población

4 Estadística: Herramientas con dos Objetivos Básicos
Describir la muestra: Estadística Descriptiva: Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.

5 Qué es la Estadística? Dos conceptos fundamentales: muestra y población
Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera

6 ¿Porqué candidato votaría usted?
Qué es la Estadística? Dos conceptos fundamentales: muestra y población ¿Porqué candidato votaría usted?

7 Qué es la Estadística? Dos conceptos fundamentales: muestra y población
Si la elección tuviera que definir entre ellos dos ¿Por cuál votaría usted?

8 Qué es la Estadística? Dos conceptos fundamentales: muestra y población
Población Objetivo? Marco Muestral? Muestra?

9 Técnicas de Muestreo ¿Cómo recolectar los datos?
Muestreo No-Aleatorizado (o No-Probabilista) Se basa en el juicio personal del investigador. Puede generar buenas muestras pero no permite una evaluación estadística de confianza. Muestreo Aleatorizado (o Probabilista) Se controla la probabilidad de seleccionar un determinado individuo del marco muestral. Permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.

10 Técnicas de Muestreo ¿Cómo recolectar los datos?
Muestreo Aleatorizado o Probabilista: Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Muestreo clusterizado Muestreo no-Aleatorizado o no-Probabilista Muestreo por convenciencia Muestreo por juicio Muestreo por cuota Muestreo tipo “bola de nieve” (snowball)

11 Técnicas de Muestreo Muestreo por Conveniencia
Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación. El criterio de selección (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.

12 Técnicas de Muestreo Muestreo por Conveniencia
Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web

13 Técnicas de Muestreo Muestreo por Juicio
Un tipo de muestreo por conveniencia Se selecciona de acuerdo a alguna característica especifica del encuestado juzgada por el encuestador Clientes/Consumidores de un cierto tipo Expertos en un tema o aspecto de la organización Personajes “líderes de opinión”

14 Técnicas de Muestreo Muestreo por Juicio

15 Técnicas de Muestreo Muestreo por Cuota
Intenta mejorar la representatividad de la muestra separando a la población de acuerdo a variables de control: edad, sexo, raza, nivel socio-económico A casa subgrupo o estrato se le asigna una cuota o proporción de muestreo, típicamente % de la población Otros criterios: varianza. Dentro del grupo se muestrea por conveniencia

16 Técnicas de Muestreo Muestreo tipo bola de nieve
Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea) Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales” Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.

17 Técnicas de Muestreo Muestreo tipo bola de nieve (ejemplo)

18 Técnicas de Muestreo Muestreo Aleatorio Simple
Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros con reemplazo: se pueden repetir elementos sin reemplazo: no se pueden repetir elementos Procedimiento: se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.

19 Técnicas de Muestreo Muestreo Aleatorio Simple
Para muchos estudios se siguen utilizando tablas de números aleatorios aunque existen muchos algoritmos generadores de los mismos. ¿cómo usar una tabla de números aleatorios?

20 Técnicas de Muestreo Muestreo Aleatorio Simple

21 Técnicas de Muestreo Muestreo Aleatorio Sistemático
Se elige un elemento de partida aleatoriamente y el resto se elige en sucesión hasta completar la muestra Regla de sucesión: Si n es el tamaño de la muestra y N el de la población muestral se determina s = floor(N/n) El genera un número aleatorio x. El k-ésimo seleccionado es (x+k·s) mod N Se elige el x-ésimo Luego el (x+s)-ésimo Luego el (x+2s)-ésimo etc

22 Técnicas de Muestreo Muestreo Aleatorio Sistemático
¿Tiene cada elemento la misma probabilidad de ser seleccionado? ¿tiene cada subconjunto la misma probabilidad de ser seleccionado? Importante: el registro de donde se selecciona no debe presentar sesgo periódico, sino se reduce la representatividad de la muestra. Si el registro está ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad. Se puede prescindir de identificar exactamente el tamaño del marco muestral

23 Técnicas de Muestreo Muestreo Aleatorio Estratificado
Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, sexo, Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato Dentro de cada estrato se puede proceder con muestreo simple o sistemático El número de elementos a elegir puede ser proporcional al tamaño o inversamente proporcional a la variabilidad del estrato

24 Técnicas de Muestreo Muestreo Aleatorio ór Grupos
Se divide a la población en grupos lo más homogéneos entre ellos y lo más heterogéneos internamente Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemática Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. En ocasiones sólo se conocen los grupos y no los elementos que componen cada grupo.

25 Técnicas de Muestreo Muestreo Aleatorio por Grupos
Ejemplo: Encuesta a los espectadores de una película: se muestrean los horarios a encuestar.

26 En el muestreo aleatorizado se elige controlando la probabilidad de selección de los elementos.
Mejorable segmentando.

27 En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio. Mejorable segmentando.

28 Muestreo por conveniencia Muestreo de bola de nieve
Técnicas de Muestreo Técnica Fortalezas Debilidades Muestreo NO probabilístico Muestreo por conveniencia Menos costoso, toma menos tiempo, más conveniente. Tendencias en la selección, muestra no representativa, *no se recomienda para la investigación descriptiva o causal. Muestreo por juicio Costo bajo, conveniente, no toma mucho tiempo. Puede a aumentar la representatividad del muestreo por conveniencia No permite la generalización, es subjetivo. Puede generar una muestra para avalar pre-juicios del investigador. Muestreo por cuota La muestra puede controlarse para ciertas características. Tendencias en la selección, no asegura la representatividad. Muestreo de bola de nieve Puede estimar características poco comunes. Toma mucho tiempo.

29 Muestreo aleatorio simple Muestreo estratificado
Técnicas de Muestreo Técnica Fortalezas Debilidades Muestreo probabilístico Muestreo aleatorio simple Se entiende con facilidad, resultados proyectables. Es difícil construir el marco de la muestra, costoso, menor precisión, no asegura la representatividad. Muestreo sistemático Puede aumentar la representatividad, más fácil de poner en práctica que el MAS, no es necesario el marco exacto de la muestra. Puede reducir la representatividad. Muestreo estratificado Incluye todas las sub-poblaciones importantes, precisión. Es difícil seleccionar las variables de estratificación relevantes, no es factible estratificar conforme a muchas variables, costoso. Muestreo de grupo Fácil de poner en práctica, costo efectivo. Inexacto, es difícil calcular e interpretar los resultados.

30 Técnicas de Muestreo Tamaño de la Muestra (n)
Problema duro de la Estadística Inferencial Criterios Generales Qué se va a medir Qué se quiere determinar Nivel máximo de error admisible Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral Variabilidad de las características a medir

31 Estadística Descriptiva ¿Cómo organizar y presentar los datos?

32 Estadística Descriptiva Experimento, Medición y Tipos de Datos
El muestreo se realiza con el objetivo de llevar a cabo un experimento: observación, medición o registro de características o atributos de la población de las cuáles se tiene incertidumbre. Lo último es lo que define un experimento Se conocen los posibles valores, pero No se sabe a-priori cuáles van a ser los resultados Es repetible bajo condiciones esencialmente equivalentes

33 Estadística Descriptiva Experimento, Medición y Tipos de Datos
Producto del muestreo y la medición obtenemos datos Para propósitos estadísticos es útil distinguir entre los siguientes tipos de datos: Numéricos o Cuantitativos Cualitativos Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medición (ejemplo: grafos, matrices)

34 Estadística Descriptiva Experimento, Medición y Tipos de Datos
Numéricos o Cuantitativos: operables aritméticamente Escala Intervalar: Tienen sentido las diferencias. Escala de Razón: Tienen sentido los cuocientes. Discretos/Continuos. Cualitativos: Categóricos: Son sólo nombres de referencia. Ordinales: Se pueden jerarquizar u ordenar.

35 Estadística Descriptiva Experimento, Medición y Tipos de Datos
Ejercicio: Deseamos estudiar los hábitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento académico Sugiera variables a medir en cada una de las categorías definidas anteriormente

36 Estadística Descriptiva Concepto Fundamental: Frecuencia
La frecuencia de un suceso en la muestra es el número de veces que éste se repite en la muestra (valor de una característica o de un subconjunto de valores). Llamaremos frecuencia relativa a la fracción de veces que éste aparece en la muestra. Si la frecuencia del suceso es k y la muestra es de tamaño n llamaremos: k/n

37 Estadística Descriptiva Presentación de los Datos
Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles Diagramas de sectores (“de torta”) Diagramas de barras

38 Estadística Descriptiva Presentación de los Datos
Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento.

39 Estadística Descriptiva Presentación de los Datos

40 Estadística Descriptiva Presentación de los Datos
Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarquía natural de los valores posibles. Ejemplo: estratos económicos:

41 Estadística Descriptiva Presentación de los Datos
Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadísticos.

42 Estadística Descriptiva Presentación de los Datos
Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningún valor. ¿Cómo presentarlos?

43 Estadística Descriptiva Presentación de los Datos
Datos Cuantitativos. Tabligrama: El último dígito se expresa separado de los más significativos. Consideremos los siguientes datos

44 Estadística Descriptiva Presentación de los Datos
Datos Cuantitativos: Tabligrama

45 Estadística Descriptiva Presentación de los Datos
Datos Cuantitativos. Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra

46 Estadística Descriptiva Presentación de los Datos
Tablas de frecuencias. ¿Cuántos intervalos K considerar? ¿Cómo deben estar estos distribuidos? Histograma: Los intervalos son todos del mismo tamaño y cubren uniformemente el rango de los datos. Rango = máximo – mínimo Amplitud de cada clase: A = (Rango+1)/K 1er Intervalo: [a1,b1]=[(min – 0.5), (min – 0.5)+A] 2do Intervalo: [a2,b2]=[b1, b1 + A] k-ésimo: [ak,bk]=[bk-1, bk-1 + A]

47 Estadística Descriptiva Presentación de los Datos
K := N° Clases R := Rango = máx { xi } - mín { xi } = = 55 A := Amplitud = ( R + 1 ) / K = ( ) / 7 = 8 Límites 106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5 Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 Frecuencias ABS - REL - REL. AC. , ,125 , ,2 , ,325 , ,525 , ,675 , ,85 ,

48 Estadística Descriptiva Presentación de los Datos
9 Histograma 8 7 6 5 4 3 2 1 110,5 118,5 126,5 134,5 142,5 150,5 158,5

49 Estadística Descriptiva Presentación de los Datos
9 Polígono de Frecuencias 8 7 6 5 4 3 2 1 102,5 110.5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

50 Estadística Descriptiva Presentación de los Datos
1 0.9 OJIVA 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5 166,5


Descargar ppt "Estadística Descriptiva: 1. Muestreo y Presentación de los Datos."

Presentaciones similares


Anuncios Google