La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Centro de Innovación y Desarrollo para la Investigación en Ingeniería del Software

Presentaciones similares


Presentación del tema: "Centro de Innovación y Desarrollo para la Investigación en Ingeniería del Software"— Transcripción de la presentación:

1

2 Centro de Innovación y Desarrollo para la Investigación en Ingeniería del Software

3 Curso de Estadística y Probabilidad para Ingenieros – CEPI –
Módulo 3: Prueba de Hipótesis: Conferencia No. 9 Lección 3.1. Técnicas de Muestreo Curso de Estadística y Probabilidad para Ingenieros – CEPI – viernes, 14 de abril de 2017

4 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA
Un estudio estadístico plantea, extraer conclusiones sobre la naturaleza de una población grande, que no puede estudiarse en su totalidad, y por lo tanto hay que analizar y valorar una parte de ella. Este hecho permite justificar y establecer diferentes técnicas de muestreo. Los términos básicos, que tratará este módulo, son: estadístico y estimación (específicamente, estimador), asumiendo que un estadístico o estimador es una variable aleatoria con una determinada distribución, en dos amplias categorías de inferencia estadística: estimación y prueba (docimasia o contraste) de hipótesis. El estimador (estadístico) debe caracterizar un parámetro poblacional, mediante métodos estimación puntual o por intervalos que debe seleccionarse mediante una serie de propiedades, que se usan como herramienta, para elegir el "mejor" entre varios estimadores. Por otra parte, deducir leyes de probabilidad en determinadas características de una población, si sólo se conoce una muestra, es el principal problema a resolver, cuando se estudian relaciones específicas y se intenta extenderlas desde una muestra particular hacia el resto de individuos de la población. Es decir, ¡ La tarea fundamental de la estadística inferencial, es hacer deducciones de la población, a partir de una muestra extraída de la misma !. viernes, 14 de abril de 2017

5 Introducción MODOS DE INFERENCIA
"En la filosofía occidental, es habitual, considerar dos modos básicos de razonar: la deducción (inferencia desde causas a efectos) y la inducción (inferencia desde los efectos hacia las causas). Además de estos modos de inferencia tradicionales, existe un primer modo -la abducción- definida como génesis de hipótesis en el razonamiento científico, proceso de razonamiento mediante el cual, se crean nuevas ideas, hipótesis explicativas y teorías científicas como primer paso en toda investigación".  Considerando la investigación un proceso: “sistemático" que parte de la formulación de una hipótesis u objetivo de trabajo, para recolectar datos según un plan preestablecido, para luego analizar e interpretar, modificar o añadir nuevos conocimientos". “sistémico" para analizar el todo integral compuesto de partes, que contribuye a complementar la formulación de hipótesis al evaluarse las interrelaciones causa-efecto, que analizadas y comprendidas, modifican o añaden nuevos conocimientos. viernes, 14 de abril de 2017

6 Objetivos de la Conferencia
El propósito de este módulo es permitir al alumno: Conceptualizar el significado básico y la forma de establecer y seleccionar estadísticos y estimadores muestrales puntuales o por intervalos de muestras de poblaciones objetivo. Conocidos los estadísticos y estimadores, aprender como realizar pruebas o contrastes de hipótesis o inferencias estadísticas. viernes, 14 de abril de 2017

7 Guión de la Conferencia
Conocimiento. Motivación: ¿Qué es y para qué sirve un estudio estadístico? Sesgo de selección Población objetivo Y Población de estudio Otros sesgos Técnica de respuesta aleatoria Técnicas de muestreo No probabilistas Probabilistas MAS Sistemático Estratificado Conglomerados Resumen Pos-test Agenda de actividades de la semana Actividad: Lección 3.1. Técnicas de Muestreo viernes, 14 de abril de 2017

8 ¿Qué es y para qué sirve un estudio estadístico?
Motivación "El método científico parte de la observación de una realidad, elaborada con hipótesis explicativas, que deben contrastarse o probarse, y si dicha hipótesis se acepta, inducir una formalización, con principios, leyes y proposiciones, para conformar una teoría científica". El modelo general del planteamiento de un estudio, sigue la siguiente secuencia: ¿Qué es y para qué sirve un estudio estadístico? Hipótesis de trabajo Objetivos Diseño de estudio Selección de variables Definición de variables Escala de medida Protocolo de recogida de datos Selección de la muestra (¿Cuántos? ¿Quiénes?) Recogida de datos Automatización de los datos Depuración de los datos Análisis Resultados Conclusiones En síntesis, la estadística, es un instrumento indispensable, para realizar este proceso. viernes, 14 de abril de 2017

9 Objetivos de un Estudio
Motivación Objetivos de un Estudio Definir objetivos es fundamental al estructurar un estudio. Deben estar claramente definidos para tomar decisiones en: el tipo de estudio más apropiado, la selección de la muestra, el tamaño muestral, las variables a medir y el análisis estadístico a realizar. “Investigar se fundamenta en la incertidumbre de algún hecho o fenómeno que el investigador desea resolver, realizando mediciones en los objetos del estudio". En el establecimiento de objetivos, es esencial, la revisión bibliográfica, como: Información sobre aspectos concretos del diseño: Estrategias Procedimientos Pautas de seguimiento Criterios de selección Determinación del tamaño de la muestra Definición de variables Instrumentos de medición Prevención de problemas Análisis estadístico Fuente de ideas susceptibles de investigación. Valoración de los conocimientos actuales sobre el tema. Valoración sobre la pertinencia y viabilidad del proyecto. Provisión del marco conceptual para la investigación. Ayuda en la delimitación del objetivo específico. Es necesaria la Comparación de los propios resultados con estudios similares y la Contribución a la valoración de la validez extrema. viernes, 14 de abril de 2017

10 la pregunta de investigación debe caracterizarse como:
Motivación la pregunta de investigación debe caracterizarse como: FACTIBLE Número adecuado de individuos Experiencia técnica adecuada Abordable en cuanto a tiempo y dinero Manejable en cuanto al alcance INTERESANTE PARA EL INVESTIGADOR. NOVEDOSA Confirma o refuta hallazgos previos Amplia hallazgos previos Proporciona nuevos resultados ÉTICA Y RELEVANTE Conocimiento científico Políticas Líneas de investigación futuras factibles, interesantes, novedosas, éticas y relevantes La no claridad en la pregunta limita calcular el tamaño muestral del estudio, dado, que se necesita precisar y conocer: seguridad de estimación, precisión de inferencia, poder estadístico o capacidad de detectar diferencias. viernes, 14 de abril de 2017

11 ¿ESTUDIO EXPERIMENTAL O NO EXPERIMENTAL?
Motivación ¿ESTUDIO EXPERIMENTAL O NO EXPERIMENTAL? Amenazas o riesgos en los estudios: Al decidir el tipo de estudio, hay que considerar sus amenazas o riesgos implícitos; los sesgos del estudio; Sesgo de selección, los grupos no son comparables por su forma de escogencia (elección inadecuada en grupos de control o espacios muestrales, pérdidas de seguimiento y supervivencia selectiva). Sesgo de información, tampoco, los grupos son comparables debido al como se obtienen los datos (instrumento de medida inadecuado, diagnóstico incorrecto, omisiones, imprecisiones, vigilancia desigual en expuestos y no expuestos, errores de clasificación, errores en los cuestionarios o procedimientos…). Sesgo de confusión, hay mezcla de efectos debido a una tercera o más variables, esta variable está asociada con la exposición a estudio, e independientemente de la exposición, es un factor de riesgo adicional. Si los pasos enunciados son correctos, se decide por el tipo de estudio a realizar; Experimental como ensayos clínicos, de campo o comunitarios, para la exposición a grupos de objetos de estudio comparables con otros grupos en el que no se intervine o al que se expone a otra intervención. No experimental, simulaciones, tal que, cuando un experimento que no se han podido realizar, se haga; estudios ecológicos, de prevalencia, de casos y controles, de cohortes o de seguimiento. Cuando hay minas por todas partes, uno, no debe aventurarse, sin un detector de minas“ (M. Susser). viernes, 14 de abril de 2017

12 Amenazas o Riesgos en los Estudios
Motivación Amenazas o Riesgos en los Estudios La confusión, que se genera, puede controlarse en el diseño y análisis del estudio, para hacerlo válido. La presencia de sesgos de selección e información podrían cuantificarse, pero invalidarían el estudio. En síntesis, realizar un estudio es una carrera de obstáculos, que aún, no siendo infranqueables, permanentemente están presentes y lo dificultan, pero que a la vez, lo hacen atractivo, en cualquier trabajo de investigación. El conocimiento de la metodología y su aplicación debe reconocerse como un elemento útil, necesario y atractivo, para responder preguntas y discriminar lo seguro y correcto de lo que no lo es tanto. viernes, 14 de abril de 2017

13 Motivación A partir de los conceptos de la teoría muestral; se ha mencionado que las poblaciones están formadas por individuos, denominados unidades de muestreo o unidades de estudio: Personas, células, familias, hospitales, países… La población ideal que se pretende estudiar se denomina población objetivo. No es fácil estudiarla por completo. Aproximamos mediante muestras que den idealmente la misma probabilidad a cada individuo de ser elegido. Tampoco es fácil elegir muestras de la población objetivo: Si llamamos por teléfono excluimos a los que no tienen. Si elegimos individuo en la calle, olvidamos los que están trabajando... El grupo que en realidad podemos estudiar (los que tienen teléfono) se denomina población de estudio. viernes, 14 de abril de 2017

14 Fuentes de sesgo Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos. El nivel económico de la población de estudio es mayor que la objetivo,... Los individuos que se eligen en la calle pueden ser mayores de edad (jubilados)… En este caso, las muestras que seleccionadas son sesgadas. El tipo de sesgo debido a diferencias sistemáticas entre población objetivo y población de estudio se denomina sesgo de selección. Hay otras fuentes de error/sesgo: No respuesta a encuestas embarazosas Consumo de drogas, violencia doméstica, prácticas poco éticas,… Mentir en las preguntas “delicadas”. Para evitar este tipo de sesgo se utilizan la técnica de respuesta aleatoria. viernes, 14 de abril de 2017

15 Técnicas de respuesta aleatoria
Reducen la motivación para mentir (o no responder) a las encuestas. ¿Si digo la verdad, se me verá el “cobre”…? ¿Cómo se hace? Ejemplo: Solicitar que lance una moneda antes de responder y… Si sale cara que diga la “opción compremetida” (no tiene por qué avergonzarse, la culpa es de la moneda) Si sale cruz que diga la verdad (no tiene por qué avergonzarse, el encuestador no sabe si ha salido cara o cruz) Aunque no se sabe cuál es la verdad en cada individuo, se puede hacer una idea porcentual sobre la población, viendo en cuánto se alejan las respuestas del 50%. viernes, 14 de abril de 2017

16 Ejemplo: ¿Ha “fumado” alguna vez?
Técnicas de respuesta aleatoria Ejemplo: ¿Ha “fumado” alguna vez? No sinceros!! 100% No Sin respuesta aleatoria Con respuesta aleatoria Diferencia entre los que han dicho sí y los que debían hacerlo por que así lo indicaba la moneda 40% No 60% Sí ¡No son mitad y mitad! Porcentaje estimado de índice de consumo de drogas es: Los que deben decir la verdad viernes, 14 de abril de 2017

17 Técnicas de respuesta aleatoria
GUÍA DE DISEÑO MUESTRAL INSUMOS DISEÑO MUESTRAL PRODUCTOS Objetivos del estudio DISEÑO MUESTRAL Conocimiento de la población MUESTREO ESTADÍSTICO Muestreo Aleatorio simple Tamaño de Muestra Aplicaciones Sistemático Muestreo de Conglomerados Estratificado Método de muestreo a utilizar. Tamaño de la muestra de la población a estudiar. Recursos disponibles viernes, 14 de abril de 2017

18 Clasificación de la técnicas de muestreo
viernes, 14 de abril de 2017

19 Técnicas de respuesta aleatoria
Cuando se eligen individuos de una población de estudio para formar muestras se encuentran las siguientes situaciones: MUESTREOS PROBABILISTAS Se conoce la probabilidad de que un individuo sea elegido para la muestra. Interesantes para usar estadística matemática con ellos. MUESTREOS NO PROBABILISTAS No se conoce la probabilidad. Son muestreos que seguramente esconden sesgos. En principio no se pueden extrapolar los resultados a la población. A pesar de ello una buena parte de los estudios que se publican usan esta técnica. ¡Puff! En adelante se trata exclusivamente muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple, sistemático, estratificado y por grupos. viernes, 14 de abril de 2017

20 Muestreo aleatorio simple (MAS)
                                   Muestreo aleatorio simple (MAS) MUESTREO ALEATORIO: Considerando una población finita, de la que se desea extraer una muestra, el proceso de extracción es tal, que hay que garantizar que cada uno de los elementos de la población, tengan la misma oportunidad de ser incluidos en dicha muestra, este proceso se denomina selección muestral aleatoria y puede plantearse bajo dos puntos de vista: Sin y Con reposición de los elementos Sin Reposición Interviene Orden No interviene el orden viernes, 14 de abril de 2017

21 Muestreo aleatorio simple (MAS)
                                                                                                       Muestreo aleatorio simple (MAS) Con Reposición Interviene Orden No interviene el orden El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, se caracteriza por que • cada elemento de la población tiene la misma probabilidad de ser elegido, y • las observaciones se realizan con reemplazo. De este modo, cada observación se realiza sobre la misma población (no disminuye en las extracciones sucesivas). viernes, 14 de abril de 2017

22 Muestreo aleatorio simple (MAS)
Síntesis, Se eligen individuos de la población de estudio, de manera que todos tienen la misma probabilidad de aparecer, hasta alcanzar el tamaño muestral deseado. Se puede realizar partiendo de listas de individuos de la población, y eligiendo individuos aleatoriamente con un computador. Normalmente tiene un coste bastante alto su aplicación. En general, las técnicas de inferencia estadística suponen que la muestra ha sido elegida usando MAS, aunque en realidad se use alguna de las que veremos a continuación. viernes, 14 de abril de 2017

23 ¿El método tal como se ha definido anteriormente es sesgado? ¿Por qué?
Muestreo sistemático Se tiene una lista de los individuos de la población de estudio. Si se desea una muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar. CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada. Cuando los elementos de la población están ordenados en fichas o en una lista, una manera de muestrear consiste en: Elegir aleatoriamente un número m, entre 1 y k; Tomar como muestra los elementos de la lista: Esto es muestreo sistemático. Si el criterio de ordenación de los elementos en la lista, es tal, que los elementos más parecidos tienden a estar más cercanos, el muestreo sistemático suele ser más preciso que el aleatorio simple, porque recorre la población de un modo más uniforme. Por otro lado, es a menudo más fácil, no cometer errores con un muestreo sistemático que con un muestreo aleatorio simple. ¿El método tal como se ha definido anteriormente es sesgado? ¿Por qué? Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas,… EJEMPLO viernes, 14 de abril de 2017

24 Muestreo estratificado
Aplica cuando se saben ciertos factores (variables, sub-poblaciones o estratos) que pueden influir en el estudio y hay que asegurar cierta cantidad mínima de individuos de cada tipo: -Hombres y mujeres, Jóvenes, adultos y ancianos… Se realiza un MAS de los individuos de cada uno de los estratos. Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo del estrato con respecto al total de la población. Un muestreo aleatorio estratificado es aquel, en el que se divide la población de N individuos, en k sub-poblaciones o estratos, atendiendo criterios importantes en el estudio de tamaños respectivos N(1), ..., N(k), realizando en cada una de estas sub-poblaciones muestreos aleatorios simples de tamaño n(i). Hay 2 técnicas: asignación proporcional y asignación optima. Al hacer un estudio de uso de barras de labios en 10 estudiantes y al hacer el muestreo aleatorio simple se reflexiona en el comportamiento de 2 estratos: masculinos (60%) y femeninos (40%) con sus respectivos tamaños (6 varones y 4 mujeres). Esto es asignación proporcional Con seguridad la precisión del carácter que se estudia, será muy alta en el grupo de los varones aunque en la muestra haya muy pocos (pequeña varianza), mientras que en el grupo de las mujeres habrá mayor dispersión. Cuando las varianzas poblacionales son pequeñas, con pocos elementos de una muestra se obtiene una información más precisa del total de la población que cuando la varianza es grande. Por tanto, si sólo se toma 10 alumnos, es más conveniente dividir la muestra en dos estratos, y tomar mediante muestreo aleatorio simple, cierto número de individuos de cada estrato, eligiendo más individuos en los grupos de mayor variabilidad. Así, probablemente, un mejor resultado es 1 varón y 9 hembras. Esto, se denomina, asignación óptima. EJEMPLO viernes, 14 de abril de 2017

25 Muestreo por grupos o conglomerados
Se aplica cuando es difícil tener una lista de todos los individuos que forman parte de la población de estudio, pero sin embargo sabemos que se encuentran agrupados naturalmente en grupos. Si se intenta hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, porque estudiar una muestra de tamaño n implica enviar a los encuestadores a n puntos distintos de la citada ciudad, de modo que en cada uno de ellos sólo se realiza una entrevista. En esta situación se puede realizar más económica, con el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente ciertos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos estudiar a todos los individuos de los grupos seleccionados o bien seguir aplicando dentro de ellos más muestreos por grupos, por estratos, por aleatorios simples,… Para conocer la opinión de los ingenieros eléctricos, podemos elegir a varias regiones colombianas, en varios provincias, y dentro de ellas varios pueblos, … Al igual que en el muestreo estratificado, al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo de unos grupos con respecto a otros. Regiones con diferente población pueden tener probabilidades diferentes de ser elegidas, provincias, electrificadoras grandes frente a pequeños,… EJEMPLO DIFERENCIA viernes, 14 de abril de 2017

26 Estimación de tamaño de muestra
Definir Población ó especificación de población meta, para no obtener casos engañosos. Comprende la traducción de la definición del problema a una afirmación exacta sobre quién debe incluirse en la muestra y quién no, y debe definirse en términos de los elementos, unidades de muestra, extensión (sitios) y tiempo (periodo a considerar). El marco de la muestra es una representación de los elementos de la población meta. Consiste en una lista o grupo de indicaciones para identificar la población sobre la que se quiere realizar el estudio. Algunos ejemplos de marco de muestra incluyen el directorio telefónico, una lista de universidades, una lista de estudiantes de un curso o materia. Si no puede compilarse una lista, deben especificarse, por lo menos, algunas indicaciones para identificar la población meta. Seleccionar la técnica de muestreo a utilizar implica la toma de varias decisiones, pues se debe decidir, se utiliza una estrategia de muestra bayesiana o tradicional, muestra con o sin reemplazo y si emplear una muestra de probabilidad o no probabilidad viernes, 14 de abril de 2017

27 Estimación de tamaño de muestra
El tamaño de la muestra refiere al número de unidades que se incluirán en el estudio, tamaño conveniente para comprobar seguridad y precisión. Para calcular el tamaño hay que tener en cuenta tres factores: Porcentaje de confianza, con el cual se quiere generalizar los datos desde la muestra hacia la población total. Porcentaje de error para aceptar al momento de hacer la generalización. Variabilidad del parámetro a estimar. Variabilidad positiva (p) y negativa (q), porque p y q son complementarias. Si se habla de la máxima variabilidad los valores de variabilidad pueden ser p = q = 0.5 ó el porcentaje que se considere adecuado para el caso. Tamaño de Muestra. Si el tamaño de la muestra o población es infinito o no se conoce con precisión su tamaño, la formula que se utiliza es: Si se conozca el tamaño de la población, entonces se aplica la siguiente fórmula: viernes, 14 de abril de 2017

28 Estimación de tamaño de muestra
EJEMPLO viernes, 14 de abril de 2017

29 Qué se vio en la Conferencia?
Motivación: ¿Qué es y para qué sirve un estudio estadístico? Sesgo de selección Población objetivo Población de estudio Otros sesgos Técnica de respuesta aleatoria Técnicas de muestreo No probabilistas Probabilistas MAS Sistemático Estratificado Conglomerados viernes, 14 de abril de 2017

30 Lección 3.1. Técnicas de Muestreo
Actividad Lección 3.1. Técnicas de Muestreo Con los conocimientos adquiridos en la conferencia iniciar con la lección propuesta en el libro de actividades. viernes, 14 de abril de 2017

31 Créditos Operación: Ing. (c) Diana Patricia Bautista Otálora
Planificación: Ing. Sergio Enrique Méndez Aceros Autoría, Instrucción y Administración: Phd. Ricardo Llamosa Villalba viernes, 14 de abril de 2017

32


Descargar ppt "Centro de Innovación y Desarrollo para la Investigación en Ingeniería del Software"

Presentaciones similares


Anuncios Google