Estadística Computacional 0. Introducción Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María
Porqué Estadística?
Porqué Estadística? Cómo interpretamos esta estadística?? (a) ¿Qué significa prevalencia? (b) ¿Cuál es la muestra? (c) ¿Cuál es el crecimiento natural de la población en Chile?
Porqué Estadística? Evolución del Consumo de Marihuana según estudio del CONACE
Porqué Estadística? Tendencia de la Percepción de Riesgo en el consumo habitual de Marihuana y Cocaína según estudio del CONACE
Porqué Estadística?
Porqué Estadística? Relación causa-efecto: estrés → aumento de la muerte fetal Cómo se valida una conclusión de esta naturaleza? Se han descartado otras variables? Cigarrillo? Edad? Qué tan significativo es el contraste de la dos muestras?
Hagamos un experimento casero … Simulemos 100 pacientes: 37 casos de muerte fetal y 63 casos de ausencia de muerte fetal (36.5% muerte fetal marginal) Seleccionamos aleatoriamente un grupo de tamaño 33 y otro de tamaño 67 (33% estrés observado) Diferencias en las tasas de muerte fetal Grupo 1 Grupo 2 Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38%
Resultados del experimento casero … Grupo 1 Grupo 2 Selección aleatoria 1: 38% 36% Selección aleatoria 2: 34% 40% Selección aleatoria 3: 32% 39% Selección aleatoria 4: 41% 34% Selección aleatoria 5: 37% 38% Puede ser aleatoria la diferencia observada por los científicos daneses? Independiente de la respuesta, Cuidado con la significancia de las diferencias: una diferencia del 7% es perfectamente aleatoria!!
Estadística: Fundamental para comprender mucha de la información que recibimos a diario y comunicar información de manera efectiva
Estadística: El 99% de las decisiones que se toman en el mundo dependen las conclusiones que se puedan obtener de una muestra
Estadística: Aceptar una innovación en un escenario con incertidumbre en un pasa por conseguir un argumento estadístico que soporte su conveniencia
Qué es la Estadística? wikipedia.org: La estadística es una rama de la matemática que se refiere a la recolección, estudio e interpretación de los datos obtenidos en un estudio. Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales (…) y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.
Estadística: Conjunto de herramientas para tomar y analizar datos de manera de obtener información acerca de un fenómeno sobre el que existe incertidumbre
Qué es la Estadística? Dos conceptos fundamentales: muestra y población Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones Muestra: subconjunto de la población que se extrae para ser estudiado
Qué es la Estadística? Dos conceptos fundamentales: muestra y población Población Muestral o Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo:
Qué es la Estadística? Dos conceptos fundamentales: muestra y población Población Objetivo? Marco Muestral? Muestra?
Estadística: Set de herramientas para análisis (?) de datos. Estadística Descriptiva: métodos de recolección, descripción, visualización y resumen de datos. Explicar qué ocurre la muestra. Estadística Inferencial: formulación de modelos explicativos o prospectivos. Generalizar hacia la población muestral. Proyectar una variable en el tiempo. Validez de las generalizaciones y proyecciones.
Estadística Descriptiva ¿Cómo recolectar los datos?
Estadística Descriptiva ¿Cómo recolectar los datos?
Estadística Descriptiva ¿Cómo organizar y presentar los datos?
Estadística Descriptiva ¿Cómo resumir los datos? Las variables son variables: cómo dar cuenta de ellas de manera compacta niveles medios tendencias variabilidad rangos
La Estadística Descriptiva se ocupa de cómo recolectar datos y presentarlos de manera informativa
Inferencia Estadística ¿Cómo generalizar desde los datos? Formulando modelos de cómo las variables cambian, que den cuenta de su aleatoriedad o incertidumbre Ejemplo: Distribución de Poisson: Poi(λ)
Inferencia Estadística Naturaleza de un Modelo Marcos conceptuales que ayudan a entender un fenómeno representándolo de manera simplificada Exactitud o validez de un modelo Más que verdadero útil
Inferencia Estadística ¿Cómo generalizar desde los datos? Los modelos estadísticos nos ayudan a ordenar fenómenos que parecen no tener orden o causa clara Nos ayudan a modelar la incertidumbre inherente a la mayoría de los sistemas complejos: grandes grupos de personas, sistemas financieros, la biosfera, el macro mundo como emergencia del mundo atómico Por lo tanto nos ayudan a decidir bajo un escenario de incertidumbre
Inferencia Estadística ¿Cómo generalizar desde los datos? Un Modelo Estadístico Simple: Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura. Medimos X en varias oportunidades: S = {15, 12, 10, 10, 12, 8, 10, 4, 4, 2, 3, 4, 10, 10, 12, 15, 14, 12, 12, 1, -0.5, 0.5,12, 10, 8, 5, 5, 1} *Olas en la costa de Donostia (San Sebastián), en el País Vasco.
Inferencia Estadística ¿Cómo generalizar desde los datos? Un Modelo Estadístico Simple: Sea X la distancia (m) a la que se acerca el mar de una línea de referencia segura 1. X < 0.1m el 1% del tiempo 2. 0.1 < X < 2m el 5% del tiempo 3. 2 < X < 4m el 30% del tiempo 4. X > 4 el 64% del tiempo * Nilómetro
Inferencia Estadística ¿Cómo generalizar desde los datos? Modelo Estadístico de Servicio Sea T el tiempo que pasa entre que dos votantes son atendidos. Notamos que en 1 hora votan más o menos 20 personas y que T > T0 = 1 minuto Probabilidad de T = t *Elecciones 2006 en Venezuela
Inferencia Estadística ¿Cómo generalizar desde los datos? Formulando modelos Formulando hipótesis acerca de la población y contrastando su validez ¿Cuál es la Hipótesis? ¿Cómo la escribimos?
Inferencia Estadística Si X mide la comprensión lectora en la población de niños que ven (T) mucha televisión (1) versus una cantidad moderada (2) (Hipótesis A) X1 < X2 (Hipótesis B) X1 ≠ X2 (Hipótesis C) X = 10 – alpha*T
Estadística Análisis de Hipótesis y Modelos Cuál es la validez de los modelos e hipótesis más allá de las muestras sobre las que podemos medir Consistencia muestral ≠ validez poblacional Significancia de las hipótesis o modelos Es foco de la estadística dar cuenta de las simplificaciones inherentes a los modelos? Sí y no: sensibilidad a los modelos estadísticos
La Estadística Inferecial construye modelos e hipótesis que expliquen la variabilidad inherente a las observaciones
Estadística: Perspectiva Histórica del latín statisticum collegium ("consejo de Estado"), de su derivado italiano statista ("político") ó del alemán staat (“gobierno”). Presente en todas las sociedades organizadas como herramienta administrativa (estudios demográficos, de renta, de productividad, de potencia bélica) Nace con los censos de población y bienes
Estadística: Perspectiva Histórica Censo del Pueblo de Israel 1300 AC. ~
Estadística: Perspectiva Histórica Censo del Pueblo de Israel 1300 AC. ~
Estadística: Perspectiva Histórica Siglo XIX: nace la estadística matemática
Estadística: Perspectiva Histórica Fines del Siglo XX: Análisis Inteligente de Datos Volúmenes gigantescos de datos, sin precedentes: observatorios, proyecto genoma, la web. Análisis manual?: Estadística automatizada Búsqueda de patrones en gigantescos volúmenes de datos: modelos estadísticos más algoritmos informáticos
Fobia a la Estadística?
Fobia a la Estadística?
Propósito número 1 de este curso: No más fobia a la estadística!
Propósito número 1 de este curso: No más fobia a la estadística! La estadística es muy sencilla si se aprenden bien los conceptos base. No se pide mucho: Atención en clases. Estudio en casa: unas hrs. A la semana bastan! lr a la Ayudantía.
Forma de Evaluación 2 certámenes (60%) 1 nota de controles (15%) 1 nota de laboratorio (25%) se exige aprobación 1 exámen (eximición con 65)