ESTUDIO ESTADÍSTICO RECURRENCIA DE TSUNAMIS SOBREDIMENSIONADOS EN LA BAHÍA DE QUINTERO MODELO PREDICTIVO PROBABILÍSTICO.

Slides:



Advertisements
Presentaciones similares
Tiempo a la falla La Probabilidad, La Confiabilidad, La Rata de Riesgo y La Probabilidad Condicional de Falla.
Advertisements

Unidad I. Conceptos Básicos y Estadística Descriptiva
“AVALIAÇÃO DE GRANDES PROJETOS PÚBLICOS”
Estadística Unidad III
Modelos de Variable Dependiente Binaria -Logit y Probit-
PRESENTACION I INTRODUCCION A LA HIDROLOGIA PROBABILISTICA
8. Distribuciones continuas
Bivariadas y Multivariadas
INTEGRACIÓN.
Desastres naturales.
PROCESAMIENTO DE DATOS DE VIENTO 1º Parte.
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
FUNCIONES DE DENSIDAD DE PROBABILIDAD
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Distribución Normal.
Unidad V: Estimación de
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Mt. Martín Moreyra Navarrete.
Distribuciones derivadas del muestreo
DISTRIBUCIONES DE MUESTREO
ESTADISTICA TEMA 12.
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Gerenciamiento Técnico de Proyectos
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Procesamiento estadístico de datos en bioquímica clínica
ESTADÍSTICAS DESCRIPTIVA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Titular: Agustín Salvia
Capacidad de Proceso.
Inferencia Estadística
Función Densidad Continua (o distribución de probabilidad continua)
Herramientas básicas.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Departamento de Salud Pública Dra. Laura Moreno Altamirano
P Y E 2012 Clase 11Gonzalo Perera1 Repaso de clase anterior Fórmula del bloqueo de Erlang. LFGN y el problema de la Robustez.
8. Distribuciones continuas
Diapositivas de matemáticas
La Distribución Normal.
Villahermosa, Tab. 21 septiembre MATERIA: Investigacion de operaciones TEMA: Lineas de espera ALUMNOS: Maria isabel vega chanona HORA: 11:00 am a.
Líneas de Espera: Teoría de Colas
Estimación y contraste de hipótesis
Regresión Lineal Simple
CINEMÁTICA La cinemática estudia el movimiento sin interesarse en qué es lo que lo causa. Se describe de qué manera se mueve una partícula. Para describir.
Aplicaciones Estadísticas a las Finanzas Clase 1
CINEMÁTICA EN UNA DIMENSIÓN
MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)
RIESGO, RENDIMIENTO Y VALOR
MEDIDAS DE TENDENCIA CENTRAL
NORMA INTERNACIONAL DE AUDITORÍA 530
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
DETECCION DE SEÑALES BINARIAS EN RUIDO GAUSSIANO El criterio de toma de decisión fue descrito por la ecuación Un criterio muy usado para escoger el nivel.
ESTADÍSTICA DESCRIPTIVA
OPTIMIZACION DEL DESEMPEÑO DE ERROR
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
Distribuciones de Probabilidad Discretas Las distribuciones discretas que se tratarán son: 1.Binomial 2.Multinomial 3.Hipergeométrica 4.Hipergeométrica.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
REGRESIÓN LINEAL SIMPLE
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
Docente: Nivis VeraAlumna:Lergi Rodriguez. Generalmente los eventos socios naturales se asocian con sucesos negativos sobre una población vulnerable,
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
Transcripción de la presentación:

ESTUDIO ESTADÍSTICO RECURRENCIA DE TSUNAMIS SOBREDIMENSIONADOS EN LA BAHÍA DE QUINTERO MODELO PREDICTIVO PROBABILÍSTICO

El contexto estadístico

El contexto estadístico Distribución normal El modelo de probabilidad más usado en estadística es la distribución normal o gaussiana.

El contexto estadístico Distribuciones con asimetría positiva y soporte mayor que cero Sin embargo, muchos fenómenos naturales no pueden describirse mediante la distribución normal ni mediante otras distribuciones simétricas. Hay diversas áreas de la ciencia donde se requieren modelos de probabilidad asimétricos.

El contexto estadístico Distribuciones de vida El análisis de tiempos de ocurrencia de eventos aleatorios es de interés en ingeniería y medicina. Este tipo de variable estadística que tiene asociada probabilidades (variable aleatoria) y que corresponde al tiempo tiene una conducta frecuentemente asimétrica, tal como lo indica el estudio pionero de: Davis (1952) Y los textos de: Lawless (2002) Marshall & Olkin (2007). La geología es también un área en donde hay interés por el estudio de la ocurrencia de eventos recurrentes, como terremotos y explosiones volcánicas.

El contexto estadístico Modelos de daño acumulativo En algunos análisis de ocurrencia de eventos en el tiempo se presenta degradación o desgaste debido a acumulación de tensión induciendo a una falla o ruptura cuando un umbral de resistencia es superado. Ingeniería: fatiga de materiales. Medicina: varios tipos de cáncer y enfermedades cardíacas crónicas. Calidad del aire: efecto acumulativo de contaminantes de la atmósfera. Calidad del agua: efecto acumulativo de nutrientes vegetales. Neurociencia: producción de espigas en neuronas. Salud pública: mortalidad humana asociada con diversos factores. Forestación: efecto del diámetro de un árbol en su mortalidad. Sismología: recurrencia de terremotos y tsunamis.

El contexto estadístico Modelos de daño acumulativo Las placas tectónicas que producen los terremotos y tsunamis van acumulando tensión en el tiempo. Con los terremotos, y tal como ocurre con la fatiga de materiales, no es posible medir la cantidad de energía acumulada, transformándose ésta en una variable latente. Sin embargo, sí es posible conocer la cantidad de tiempo que ha transcurrido desde el terremoto predecesor, es decir desde la ruptura anterior.

El contexto estadístico Probabilidad condicional Considere dos eventos aleatorios “A” y “B”. La probabilidad de que ocurra “A” dado que ya ocurrió “B” se define como: P(A | B) = P(A n B) / P(B) En particular, considere “T” como el tiempo hasta ocurrencia de un evento determinado y “A = { T > t }” y “B = { T < dt + t }”, entonces la probabilidad de que ocurra le evento antes de tiempo dt + t, dado que ya ha transcurrido un tiempo t es P(T < dt + t | T > t) = P(t < T < dt + t) / P(T > t) = (P(T < t + dt + t) - P(T < t ))/( 1- P(T < t)) t dt + t

El contexto estadístico Tasa de fallas o de riesgo Considere una variable aleatoria T y sus fdp f(t) y fda F(t) correspondientes. Entonces, la tasa de riesgo o amenaza es h(t) = f(t) / (1 – F(t)); t > 0. Gráfico TTT La tasa de fallas, amenaza o riesgo indica qué tan propenso es que un evento que no ocurrido hasta una fecha determinada ocurra en el instante inmediatamente siguiente. Esta tasa no es una probabilidad (sólo en el caso de variables aleatorias discretas lo es, que no es el caso del tiempo, ya que éste es una variable continua), La tasa de riesgo permite distinguir distribuciones, lo que no es fácil de hacer al mirar una fdp y su histograma correspondiente.

Los datos

Escenario 1 Escenario 2 Evento Límite inferior Centro del intervalo Tabla 1. Fechas en que ocurrieron los tsunamis sobredimensionados en Bahía de Quintero, de acuerdo al estudio geológico Evento Límite inferior Centro del intervalo Límite superior A 3984 A.C. 4082 A.C. 4180 A.C. B 3639 A.C. 3672 A.C. 3705 A.C. C 2919 A.C. 2970 A.C. 3020 A.C. D 2340 A.C. 2407 A.C. 2474 A.C. E 1775 A.C. 1860 A.C. 1945 A.C. F 1637 A.C. 1688 A.C. 1739 A.C. G 786 A.C. 803 A.C. 819 A.C. H 3 D.C. 42 D.C. 80 D.C. I 265 D.C. 338 D.C. 410 D.C. J 1643 D.C. 1720 D.C. 1796 D.C. Escenario 2 Tabla 2. Fechas en que ocurrieron los tsunamis sobredimensionados en Bahía de Quintero, de acuerdo al estudio geológico, más un dato imputado Evento Límite inferior Centro del intervalo Límite superior A 3984 A.C. 4082 A.C. 4180 A.C. B 3639 A.C. 3672 A.C. 3705 A.C. C 2919 A.C. 2970 A.C. 3020 A.C. D 2340 A.C. 2407 A.C. 2474 A.C. E 1775 A.C. 1860 A.C. 1945 A.C. F 1637 A.C. 1688 A.C. 1739 A.C. G 786 A.C. 803 A.C. 819 A.C. H 3 D.C. 42 D.C. 80 D.C. I 265 D.C. 338 D.C. 410 D.C. I’ 835 D.C. 890 D.C.(*) 945 D.C. J 1643 D.C. 1720 D.C. 1796 D.C.

El modelo predictivo probabilístico

El modelo predictivo probabilístico Basados en los comentarios del “contexto estadístico-modelos de daño acumulativo”, contamos con 2 elementos que nos ayudaron a escoger el modelo estadístico usado en el análisis. Estos elementos son: El tiempo entre ocurrencias de terremotos gigantes y a acumulación de energía, cuya liberación después de superar el umbral de resistencia, provoca la ocurrencia del evento sísmico que genera los tsunamis. Estos dos elementos permiten proponer una clase de distribuciones estadísticas de daño acumulativo como modelos predictivos probabilísticos. Éstas son: La distribución Birnbaum-Saunders (BS) o de fatiga, La distribución gamma, La distribución gaussiana inversa (GI), La distribución log-normal y La distribución Weibull.

Análisis exploratorio de los datos

Análisis exploratorio de los datos Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Análisis exploratorio de los datos Datos Mediana Promedio D.E. C.V. C.S. C.C. Rango Mín. Máx. n Escenario 1 (izq) 512.0 587.7 370.7 63.1% 0.48 -0.89 1222.5 87 1309.5 9 Esc. 1 (centro) 562.5 644.6 364.2 56.5% 0.60 -0.67 1210.0 172 1382.0 Escenario 1 (der) 614.0 701.5 359.5 51.3% 0.71 -0.45 1197.5 257 1454.5 Escenario 2 (izq) 496.0 523.5 254.6 48.6% -0.21 -1.44 747.5 834.5 10 Esc. 2 (centro) 557.5 580.2 240.0 41.4% -0.23 -1.41 713.5 885.5 Escenario 2 (der) 619.5 636.9 227.2 35.6% -0.26 -1.35 679.5 936.5

Elección del modelo

Elección del modelo Escenario 1 Escenario 2 Escenario 1 Distribución Tabla 5. Indicadores de bondad de ajuste y criterios de selección de modelos para las distribuciones y escenarios indicados Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Elección del modelo Escenario 1 Distribución Valor-p KS AIC BIC R2 BS 0.911 133.571 133.966 99.94% Escenario 1 Escenario 2

Estimación del modelo predictivo probabilístico

Estimación del modelo predictivo probabilístico Tabla 4. Resumen de estadísticas descriptivas de tiempos (en años) para los escenarios indicados Tabla 5. Indicadores de bondad de ajuste y criterios de selección de modelos para las distribuciones y escenarios indicados Estimación del modelo predictivo probabilístico Escenario 1 Escenario 2 Probabilidad(0 < T < t1 | T > 282) Probabilidad(t1 < T < t2 | T > 282) Intervalo de tiempo (0, t1) Límite inferior Centro Límite superior Dentro de 5 años más 0,80% 0,60% 0,40% 0,90% 0,30% Dentro de 10 años más 1,60% 1,20% 1,90% Dentro de 15 años más 2,50% 1,80% 2,90% 1,00% Dentro de 20 años más 3,30% 1,70% 3,80% 2,60% 1,40% Dentro de 25 años más 4,10% 3,10% 2,10% 4,80% Dentro de 50 años más 8,20% 6,40% 4,50% 9,70% 6,90% 3,90% Dentro de 100 años más 16,50% 13,40% 10,00% 19,70% 15,10% 9,50% Dentro de 200 años más 32,20% 28,30% 23,00% 38,90% 33,50% 25,10% Dentro de 300 años más 46,20% 42,70% 37,10% 55,40% 51,40% 43,40% Dentro de 400 años más 58,00% 55,60% 50,70% 68,40% 66,50% 60,70% Dentro de 500 años más 67,70% 66,40% 62,60% 78,30% 78,10% 74,60% Dentro de 600 años más 75,50% 75,10% 72,50% 85,40% 86,20% 84,60% Escenario 1 Escenario 2

Tasa de riesgo Escenario 1 Escenario 2

Conclusiones

Conclusiones Mediante estudios históricos y geológicos se reconoció la ocurrencia de 10 tsunamis sobredimensionados en la Bahía de Quintero durante los últimos 6.000 años. El análisis estadístico realizado se basó en los datos de tiempos transcurridos entre tsunamis, que ocurrieron en promedio cada 600 años, lo que estadísticamente es una muestra pequeña. Ya que las fechas de los eventos consistieron de intervalos y no datos puntuales, esto se solucionó a través de métodos para datos simbólicos por intervalos.

Conclusiones Una tercera dificultad fue considerar un evento no detectado por la geología mediante imputación de datos, contando así con dos escenarios de observaciones de tiempos de ocurrencia. El análisis estadístico fue realizado en ambos escenarios. Primero se realizó un análisis exploratorio para validar los modelos predictivos probabilísticos propuestos que permitieron predecir la probabilidad de ocurrencia de tsunamis sobredimensionados en la Bahía de Quintero. Luego se usaron métodos de bondad de ajuste y de selección para escoger los modelos predictivos probabilísticos adecuados. En ambos escenario el modelo basado en la distribución Birnbaum-Saunders resultó ser muy apropiado. Este modelo fue usado para estimar las probabilidades de ocurrencia de tsunamis sobredimensionados en Quintero, obteniéndose resultados relativamente similares para ambos escenarios.

Conclusiones Las probabilidades condicionales al tiempo transcurrido desde el último evento (1730), permitieron detectar los mayores riesgos de ocurrencia alrededor de los próximos 900 y 800 años para los escenarios 1 y 2, respectivamente. Desde el punto de vista del “peor escenario posible” y considerando que la vida útil de la planta es de 25 años, los resultados indican que existe una probabilidad cercana al 5% de que ocurra un tsunami sobredimensionado en Quintero . Si se considera una perspectiva de 50 años, a partir de hoy, la probabilidad se duplica siendo cercana al 10%. Esto quiere decir que hay una posibilidad en diez de que ocurra un evento de ese tipo durante los próximos 50 años.

Conclusiones Aumentando la perspectiva temporal, la probabilidad de ocurrencia de un tsunami sobredimensionado en los próximos 100 años alcanza al 20% y aproximadamente al 40% a los 200 años. Las probabilidades continúan aumentando en forma más o menos lineal llegando a estabilizarse aproximadamente cerca de los próximos 800 años, valor que podría considerarse como uno de los instantes más probables de que ocurra un tsunami sobredimensionado en Quintero. Finalmente, los modelos predictivos probabilísticos paramétricos usados fueron contrastados con una metodología no paramétrica basada en la tasa de riesgo que proporcionó resultados totalmente coherentes y coincidentes entre estas metodologías paramétrica y no paramétrica.