Modelos probabilísticos

Slides:



Advertisements
Presentaciones similares
REGRECION LINEAL SIMPLE, MULTIPLE Y CORRELACION. REGRECION LINEAL SIMPLE.
Advertisements

Un criterio para detectar outliers. Otro criterio para detectar errores groseros (outliers)
El análisis de los riesgos determinará cuáles son los factores de riesgo que potencialmente tendrían un mayor efecto sobre nuestro proyecto y, por lo.
Econometría MSc. Daisy Espallargas Ibarra. Cumplimiento de los Supuestos del Modelo  No Autocorrelación Serial  Bibliografía: Econometría, Damodar N.
DISTRIBUCIONES ESTADÍSTICAS Realizado por: Claudia Morales y Denise Muñoz.
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
TEMA 2: PARÁMETROS ESTADÍSTICOS. INDICE 1. Parámetros estadísticos: 1.1 Definición 1.2 Medidas de Centralización: Medias, moda y Mediana 1.3 Medidas de.
Tema 2. Parámetros estadísticos. Indice 1. Parámetros estadísticos. Tipos: 1.1 Medidas de centralización(medias y moda) 1.2 Medidas de posición(mediana,
República Bolivariana de Venezuela Instituto Universitario Politécnico “Santiago Mariño" Estadísticas I - OV Estadística Profesor : Bachiller: Pedro Beltrán.
GASES.
MUESTREO ALEATORIO ESTRATIFICADO
Estadística Aplicada a Sistemas de Gestión de Calidad
MEP- II.
06 – Variograma modelado Propiedades del variograma Modelos básicos
Distribuciones bidimensionales: Relación entre dos variables estadísticas Tema 3:
CALCULO DE LÍMITES Elaborado por: Ing. Juan Adolfo Álvarez Martínez Noviembre,
Luis Eduardo Araya Ramos Universidad de Oriente
Facultad de Ciencias Sociales
02 - Estudio Exploratorio de Datos: Univariable y Multivariable
TEMA 3: Distribuciones bidimensionales: relación entre dos variables estadísticas. Cristhian Lopez.
DISTRIBUCIONES EN EL MUESTREO
FUNCIONES, PROCESAMIENTO ELEMENTAL DE DATOS
El modelo simple de regresión
Introducción a la geostadística
03 - El Modelo Probabilístico en Geoestadística
MUESTREO ALEATORIO CON REPOSICIÓN
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
TEMA 6 : DISTRIBUCIONES ESTADÍSTICAS.
Convergencia de variables aleatorias
ESTADÍSTICA BIDIMENSIONAL
VARIABLES REGIONALIZADAS Jhordan Jose Mateo Mendoza Ciclo: II Sección: GV81.
ESTADÍSTICA UNIDIMENSIONAL
CI43A Análisis de Sistemas de Transporte
X CONGRESO LATINOAMERICANO DE SOCIEDADES DE ESTADÍSTICA
CORRELACIÓN CAP 8 DE Peña y Romo.
Métodos de muestreo.
REGRESIÓN LINEAL SIMPLE
UNIDAD DIDÁCTICA Semana 11
NÚMEROS CUÁNTICOS NM2.
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
ASIGNATURA: GEOESTADISTICA
Estadística social fundamental
PROBABILIDAD Y ESTADÍSTICA
CONTENIDO Teoría del muestreo ¿Cómo seleccionar una muestra?
CONTENIDOS.
Aplicaciones Estadísticas a las Finanzas
VARIOGRAMA EXPERIMENTAL Es una herramienta que permite analizar el comportamiento espacial de una propiedad o variable sobre una zona dada. Ejemplo: Detectar.
Kriging Consideremos información de determinada propiedad en el yacimiento y puntos en los cuales se tiene la estimación dea partir de los puntos.
ESTADÍSTICA BÁSICA.
2016 / 17 ESCALA Informe evolutivo sobre resultados en la Prueba
Distribuciones de Probabilidad DISTRIBUCIÓN BINOMIAL
TEMA 1.- INTRODUCCIÓN A LA INFERENCIA
Crecimiento de poblaciones
Estadística Descriptiva
Dr. Carlomagno Araya Alpízar
Dr. Carlomagno Araya Alpízar
Tema 8: Procesos Estocásticos
Dr. Alejandro Salazar – El Colegio de Sonora
Operadores básicos- Modelos geomáticos (Macro Modeler)
Cambio de soporte, estimación global
“Medidas de dispersión”
Inferencia Estadística
MODELOS DE PRONOSTICOS
ESTADISTICOS Y DISTRIBUCIONES MUESTRALES
ESTADÍSTICA BIDIMENSIONAL
Contenido VARIOGRAMA EXPERIMENTAL VARIOGRAMA TEÓRICO Propiedades básicas Definición Estudio de modelos de variograma Cálculo a partir de los datos Características.
Método, Asignación y Medición
ANALISIS DE REGRESION SIMPLE
REGRESION LINEAL SIMPLE
ACTIVIDAD RESULTADOS ISCE 2018
Transcripción de la presentación:

Modelos probabilísticos   La geoestadística busca estudiar “variables regionalizadas”, es decir, variables numéricas que se extienden en el espacio geográfico, por ejemplo:  ·      ley de cobre en un yacimiento cuprífero, potencia de una veta de oro  ·      porosidad y permeabilidad de la roca en un depósito petrolero  ·      concentración de un elemento contaminante en la atmósfera  ·      pH y tasa de aluminio de muestras de suelo  ·      densidad de árboles en una zona forestal Ahora bien, en la mayoría de las situaciones, un modelamiento determinista de la variable regionalizada en estudio no es concebible, dada la gran complejidad de esta variable. Un modelo probabilístico es más adecuado, pues permite considerar tanto lo que se conoce de la variable (mediciones disponibles por la toma de muestras) como lo que se desconoce (concepto de probabilidades).

Límites de la estadística “clásica”    Se considera las observaciones como realizaciones independientes de una misma variable aleatoria. Esta interpretación impide una previsión precisa de un valor no muestreado

El modelo geoestadístico   Se considera “interacciones” entre las observaciones, de modo de tomar en cuenta sus dependencias espaciales Aquí, se puede prever el valor en un sitio no muestreado gracias a su interacción con los sitios circundantes

Formalización matemática    Se interpreta cada valor de la variable regionalizada en estudio z(x) como una realización de una variable aleatoria Z(x) Las variables {Z(x), x  D} constituyen una función aleatoria   la variable regionalizada es una realización de una función aleatoria    Cuidado  Las diferentes variables aleatorias {Z(x1),Z(x2)... Z(xp)} NO son independientes variables aleatorias correlacionadas aspecto errático estructura espacial

Caracterización de una función aleatoria    Es ilusorio querer caracterizar enteramente la función aleatoria a partir de un número restringido de datos. Por ende, sólo se considera los parámetros más relevantes o “primeros momentos”, los cuales son:  ·      esperanza de un valor: m(x) = E[Z(x)]  ·      varianza de un valor: s2(x) = var[Z(x)]  ·      covarianza entre dos valores: C(x,y) = cov[Z(x),Z(y)]  ·      variograma entre dos valores: g(x,y) = var[Z(x) – Z(y)] / 2   Los parámetros lejos los más importantes son los dos últimos, pues se refieren a la interacción existente entre dos valores, luego dan una imagen sintética de la estructuración de la variable regionalizada en el espacio. La covarianza indica qué tan semejantes son los valores entre dos sitios, mientras que el variograma qué tan desemejantes son.

Las hipótesis de estacionaridad   ¿Por qué? Consideremos la siguiente sucesión de muestras, ubicadas en una malla regular de espaciamiento 100m: sitio x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 valor 5 1 3 6 2 4 ¿Cuánto valen la esperanza en el sitio x1 y la covarianza entre los valores en los sitios x1 y x2? No se puede contestar a esta pregunta si se dispone de una sola realización: no tiene sentido hablar de la esperanza de 5 y de la covarianza entre los valores 5 y 1... El cálculo de los momentos necesita una repetición de los valores aleatorios, lo cual se logra gracias a las hipótesis de estacionaridad.

Hipótesis de estacionaridad de segundo orden  ·  la esperanza es constante: m = E[Z(x)]  ·  la covarianza entre dos valores depende solamente de su separación:  C(h) = cov[Z(x),Z(x + h)] Consecuencias  ·  la varianza es constante: s2 = var[Z(x)] = C(0)  ·  el variograma entre dos valores sólo depende de su separación:  g(h) = var[Z(x) – Z(x + h)] / 2 = C(0) – C(h)    Bajo esta hipótesis, covarianza y variograma son dos herramientas equivalentes.

Evaluación práctica de los momentos m  media({5,1,3,6,5,2,1,5,2,4,5,6}) s2  varianza({5,1,3,6,5,2,1,5,2,4,5,6}) C(100m)  cov({5,1},{1,3},{3,6},{6,5},{5,2},{2,1},{1,5},{5,2},{2,4},{4,5},{5,6}) C(200m)  cov({5,3},{1,6},{3,5},{6,2},{5,1},{2,5},{1,2},{5,4},{2,5},{4,6}) C(300m)  cov({5,6},{1,5},{3,2},{6,1},{5,5},{2,2},{1,4},{5,5},{2,6}) ¿Qué traduce la estacionaridad? La estacionaridad significa una homogeneidad de las características de la variable regionalizada: media y dispersión aproximadamente constantes, estructuración de los valores similar en todas las regiones del espacio. Se puede restringir la hipótesis de estacionaridad a escala local (noción de casi-estacionaridad), es decir, que es valedera hasta una distancia máxima.

g(h) = var[Z(x) – Z(x + h)] / 2 Hipótesis intrínseca (estacionaridad de los crecimientos de la variable) ·  la esperanza es constante: m = E[Z(x)] ·  el variograma entre dos valores depende solamente de su separación:  g(h) = var[Z(x) – Z(x + h)] / 2 Consecuencias A diferencia de la hipótesis anterior, aquí la varianza y la covarianza no existen necesariamente. Por eso, el variograma constituye una herramienta más general que la covarianza. Existe una covarianza sólo si el variograma se estabiliza al infinito, caso en el cual se tiene  ·  varianza: s2 = g() = C(0)  ·  covarianza: C(h) = C(0) – g(h)

Evaluación práctica de los momentos m  media({5,1,3,6,5,2,1,5,2,4,5,6}) g(100m)  var({4,-2,-3,1,3,1,-4,3,-2,-1,-1}) / 2 g (200m)  var({2,-5,-2,4,4,-3,-1,1,-3,-2)} / 2 g (300m)  var({-1,-4,1,5,0,0,-3,0,-4}) / 2 Hipótesis casi-intrínseca Se puede restringir la hipótesis intrínseca a escala local, lo cual significa que es válida hasta una distancia máxima. La escala de trabajo y la eventual presencia de tendencias desempeñan un papel importante en la decisión de considerar la variable regionalizada como una realización de una función aleatoria estacionaria o intrínseca.

Ejemplo

Caso de estudio: datos mineros 2376 datos compositados de 12m de largo con sus leyes de cobre creación de compósitos a partir de testigos:

Mapa de ubicación de las muestras Da una visión sintética de la organización espacial de las leyes

Estadísticas elementales Se considera una ponderación no uniforme de las muestras, de modo de corregir los efectos de las irregularidades de muestreo  la distribución de leyes es cercana a una lognormal

Nubes direccionales Permiten detectar las observaciones más atípicas y estudiar la pertinencia de una hipótesis de estacionaridad  efecto proporcional: las zones de altas leyes tienen mayor dispersión  casi-estacionaridad

Nube de correlación diferida Se visualiza el valor en un sitio en función del valor en un sitio alejado de 20m.

Nube de correlación entre medias y varianzas locales La zona de estudio ha sido dividida en 72 celdas de tamaño 100 m × 100m × 40m en cada una de las cuales se calcula la media y la varianza experimental regresión: