Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porMaría Soledad Luz Roldán Segura Modificado hace 10 años
1
INSTITUTO NACIONAL DE ECOLOGÍA DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN URBANA REGIONAL Y GLOBAL DIRECCIÓN DE INVESTIGACIÓN SOBRE LA CALIDAD DE AIRE Ma. Guadalupe Tzintzun Cervantes tzintzun@ine.gob.mx
2
IMECA Frecuencia 0 20 40 60 80 100 120 140 160 180 -50050100150200250300 TALLER DE “CALIDAD DEL AIRE Y RED DE MONITOREO AMBIENTAL” Identificación e implementación de técnicas estadísticas para el análisis de la información de calidad del aire y estimación de pronósticos Bógota-Colombia
3
Métodos Estadísticos para el Análisis de Datos de Calidad del Aire Existe más de una técnica estadística para un determinado análisis de la información de Calidad del Aire y en cada técnica se hacen suposiciones que pueden o no ser apropiadas para las circunstancias especificas del problema a resolver.
4
Análisis exploratorio de los datos Análisis gráfico de los datos Características de los datos a través del uso de estadísticas descriptivas El análisis exploratorio de los datos permite aparte de visualizar la estructuras, comportamientos y relaciones de las variables bajo estudio, verificar su calidad, cantidad y consistencia.
5
Análisis gráfico de los datos Una excelente gráfica estadística es aquella que comunica ideas complejas con claridad, precisión y eficiencia. Al desplegar una gráfica se quiere lo siguiente: Mostrar los datos Evitar distorsionar lo que los datos dicen Presentar un conjunto de datos en un pequeño espacio Hacer coherente un conjunto de datos grande Los datos revelen niveles de detalle a simple vista
6
Histograma El histograma es el más común, para dibujarlo se parte de una tabla de frecuencias o distribución de frecuencias en la cual se organizan y distribuyen los posibles valores de una variable. Frecuencia por hora de los máximos diarios de ozono que exceden 0.11, 0.15, 0.2, 0.25 y 0.3 ppm en la ZMVM, 1996-2000
7
Histograma de los máximos diarios de ozono que exceden 0.11 ppm en la ZMVM 1996-2000
8
Gráficas en el tiempo Con este tipo de gráficas es posible visualizar el comportamiento (o patrón) del fenómeno de interés a lo largo del tiempo para determinar algún tipo de tendencia: cíclica, periodica, etc. Comportamiento de las PM10 del 1 al 5 de enero de 1998 en la ZMVM
9
Gráficas de dos escalas Son otro tipo de gráficas en el tiempo, cuya característica principal es visualizar dos variables con diferentes unidades de medición, lo cual permite determinar posibles relaciones en el tiempo entre ellas. Comportamiento del Ozono y la Temperatura el 1 de enero de 1998 en la ZMVM
10
Gráficas de dispersión Este tipo de gráficas son utiles para visualizar posibles asociaciones entre dos variables. Es necesario contar con información bivariada. Existen diferentes tipos de asociación, entre los principales se encuentran: asociación lineal directa, lineal inversa, curvilínea directa y curvilínea inversa. Asociación lineal. Este tipo de asociación gráficamente se representa por medio de una línea recta. Asociación curvilínea. Este tipo de asociación gráficamente se representa por medio de una línea curva. Asociación directa. A medida que una de las variables incrementa sus valores, la otra variable también. Asociación inversa. A medida que una de las variables incrementa sus valores, la otra variable decrementa los suyos.
11
Gráfica de dispersión de contaminantes criterio y variables meteorologicas del 1 de enero de 1998 en la ZMVM
12
Gráficas de Caja Comparación anual de la máximos diarios de Ozono en las principales ciudades de la República Mexicana ZMVM ZMG Juárez Mexicali ZMM Tijuana ZMVT 365 362365363365 N = 300 250 200 150 100 50 0 IMECA Comparación del máximo diario de Ozono en 1998 de las principales ciudades de la República Méxicana Con este tipo de gráficas es posible determinar visualmente un resumén de los datos ya que proporciona el rango, el rango intercuantilico, la mediana y las estadísticas de orden de la variable de interés.
13
Mapas de datos Con los mapas se despliega un conjunto de datos muy grande en el espacio, la impresión visual de los datos se conjunta con los límites geográficos de la zona a la que pertenecen.
14
Distribución Espacial de Ozono en la ZMVM el día 20 de Mayo de 1998 hora a hora Menor concentración de Ozono
15
01:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
16
02:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
17
03:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
18
04:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
19
05:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
20
06:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
21
07:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
22
08:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
23
09:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
24
10:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
25
11:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
26
12:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
27
13:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
28
14:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
29
15:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
30
16:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
31
17:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
32
18:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
33
19:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
34
20:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
35
21:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
36
22:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
37
23:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
38
24:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC
39
Estadísticas Descriptivas En algunas investigaciones se obtienen numerosos datos que deben reducirse para lograr una interpretación adecuada. En estas situaciones la estadística descriptiva es utilizada como un valioso instrumento de análisis para describir y analizar las características de las observaciones y sobre las relaciones que existen con las características de otros conjuntos con los que se compare. Las estadísticas descriptivas más comunes caen basicamente dentro de tres grupos: Medidas de tendencia central o localización Medidas de dispersión Medidas de la forma de la distribución
40
Medidas de tendencia central o localización Con estas medidas podemos ubicar en qué valor se centran las observaciones y las más usuales son: media aritmética (promedio) mediana Moda cuartiles, deciles, percentiles (cuantiles) media geométrica media armónica
41
Medidas de dispersión Esta medida indica que tanto se alejan los datos de una medida central especifica, la más común es la media y las más usuales son: Rango Rango intercuantilico Varianza Desviación estándar Coeficiente de correlación
42
Medidas de la forma de la distribución Para estudiar la forma de la distribución de una variable se necesita disponer de un número de observaciones lo suficientemente grande como para poder deducir la regularidad o forma general del comportamiento de los valores observados. El histograma permite describir la forma de la distribución. De la visualización de este gráfico puede deducirse si los valores observados están o no muy concentrados en pocos valores de la variable, si la concentración se produce en el centro del recorrido de la variable o en uno de los extremos. Dos de estas medidas son: sesgo curtósis
43
Estadísticas descriptivas de las concentraciones (ppm) máximas diarias de ozono de cinco estaciones de monitoreo* en la ZMVM *Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella
44
Tendencia histórica de los máximos diarios de ozono de cinco estaciones de monitoreo* en la ZMVM *Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella
45
Funciones de distribución (Modelos de Probabilidad) IMECA Frecuencia 0 20 40 60 80 100 120 140 160 180 -50050100150200250300 El análisis gráfico y las estadísticas descriptivas muestran diferentes comportamientos en la forma de la distribución de la variable. Estas formas pueden lleva a asociaciones preliminares de la distribución de la variable con algunos modelos matemáticos, de los que se conocen propiedades que permiten realizar un análisis más científico del comportamiento de variable. A este tipo de modelos se les conoce como funciones de distribución.
46
Funciones de distribución (Modelos de Probabilidad) Las funciones de distribución se clasifican en discretas y continuas, esta clasificación depende de que la variable sea discreta o continua. Es discreta cuando sólo pueden tomar algunos valores en un intervalo y no es posible que llegue a tomar algún valor entre dos números y continua cuando puede tomar cualquier valor dentro de un intervalo. Por lo que para asociarle una función de distribución a una variable se debe considerar el rango de valores que esta puede tomar.
47
Funciones de distribución discretas Si x es una variable discreta que puede tomar distintos valores la función denotada por f x (x) y definida como es llamada la función de densidad de x donde es la probabilidad de que x tome el valor de. De la función de densidad discreta de x se puede obtener la función de distribución de x, como se muestra a continuación
48
Funciones de distribución discretas Una función de densidad discreta satisface los siguientes tres puntos: a) b) c) Donde la suma es sobre todos los valores de La variable x.
49
Funciones de distribución discretas El valor esperado o media ( =E (x)), se define como La varianza, la cual es una medida de dispersión con respecto al valor esperado, se define como: La desviación estándar, al igual que la varianza mide que tanto se alejan los valores de la variable de la media y se define como :
50
Distribución Bernoulli Considérese un experimento donde el resultado sólo puede tener dos opciones "éxito" o "fracaso", esto es, la variable x puede tomar los valores X= 1, si se tiene éxito X = 0, si no se tiene éxito Ahora bien, sea el experimento es modelado con la función de distribución Bernoulli, cuya expresión matemática esta dada por: El valor esperado y la varianza para la distribución Bernoulli están dadas por µ = p y 2 = p(1-p)
51
Distribución Binomial Cuando el experimento anterior se realiza n veces de manera independiente, los valores de la variable pueden ser 0,1,2,....., n éxitos, esto es hay x resultados con éxito y n-x resultados en los que no se tiene éxito, y se modela con la función de distribución Binomial, cuya expresión matemática para la densidad esta dada por, Su media y varianza están dadas por µ = np y 2 = np(1-p)
52
Distribución Poisson En ciertas aplicaciones en las cuales se modela con la distribución binomial con frecuencia, el valor de p es pequeño y el de n grande (mayor que 50). En estos casos la distribución binomial puede aproximarse con la función de distribución Poisson cuya expresión matemática esta dada por: µ = y 2 =
53
Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire El número de excedencias a la norma de un determinado contaminante digamos NO 2, puede ser tratado como un proceso Bernoulli, ya que cada valor máximo diario se compara con el valor de la norma para ver si este se rebasa o no, y por tanto se puede aplicar la distribución Binomial. Para poder aplicar este modelo se supone que las excedencias de NO 2 son eventos independientes, dado que al considerarse los valores máximos diarios, se rompe la relación entre ellos, los 365 días del año pueden suponerse 365 eventos independientes Bernoulli.
54
Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire Para eventos históricos se sabe que el número de excedencias al año de NO 2 es aproximadamente de 3, esto es, en promedio el número de días que se excede la norma de NO 2 es 3. Esto es, el número de excedencias al año se modela con una distribución Binomial con n =365 y p =3/365, ya que por inferencia estadística es bien conocido que p se estima con Al aproximar utilizando la distribución Poisson considerando p pequeño y n grande se tiene que 3 y el modelo queda dado por
55
Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire Una vez que se tiene el modelo es válido preguntarnos por la probabilidad de 4 excedencias en el año. Lo anterior es muy fácil de calcular se puede hacer el calculo directo o bien recurrir a tablas. Utilizando notación matemática, la pregunta se traduce a Esto es, la probabilidad de que haya 4 excedencias de NO 2 en un año es de 0.168. Si nos preguntamos por a lo más 4 excedencias, la probabilidad esta dada por
56
Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire
57
Funciones de distribución continuas La función de densidad continua f x (x) se representa con una curva continua tal que el área incluida bajo la curva es 1 esto es área =1
58
Funciones de distribución continuas La densidad f x (x) se obtiene para calcular áreas entre dos valores. Si f x (x) es la función de densidad de una variable continua, se obtiene la función de distribución F x (x) para un valor de la variable x como: De manera similar Para un rango particular de la variable x, digamos
59
Funciones de distribución continuas En el caso de una variable continua el valor esperado y la varianza de x están dados por:
60
Distribución Uniforme Continua Supongamos que x es una variable aleatoria continua que toma los valores en el intervalo [a,b], donde ambos a y b son finitos. Si la dese dice que x esta distribuida uniformemente en el intervalo [a,b]. Si la densidad de x esta dada por se dice que x esta distribuida uniformemente en el intervalo [a,b] El valor esperado y la desviación estándar para una variable que sigue una distribución uniforme están dados por
61
Simulación Monte Carlo La distribución Uniforme es útil para generar variables aleatorias continuas con una distribución especifica. Supongase que X se distribuye bajo una función de probabilidad conocida. Sabemos que, esto es U = F(x) sigue una distribución Uniforme [0,1], por lo que la transformación inversa de F(x), tendrá la distribución deseada. Si la expresión no se puede resolver analíticamente, es posible obtener algoritmos en la computadora que la aproxime
62
Distribución Normal El modelo de distribución normal es el resultado de la suma de muchas otras variables aleatorias continuas no relacionadas. Considérese un modelo idealizado en el cual X 1, X 2,..., X n son variables aleatorias independientes con una distribución común con media o = 0 y varianza 2 = 1. Utilizando el Teorema de Limite Central, la variable Z tiende a distribuirse como una normal en el límite cuando n es grande. La distribución normal estandarizada tiene la siguiente expresión matemática:
63
Distribución Normal Esta función de densidad es simétrica con respecto del cero y tiene forma acampanada. Su función de distribución acumulativa esta dada por: Esta integral no puede ser evaluada analíticamente, pero existen tablas para su evaluación.
64
Distribución Normal La expresión de la distribución normal no estandarizada alrededor de la media esta dada por la siguiente expresión matemática Para diferentes valores del valor esperado y la desviación estándar, la curva de distribución normal asume formas distintas, pero siempre del mismo tipo de campana. Variando sólo la media, la curva se desplaza, conservando la misma forma a la derecha ó a la izquierda. Si se varia la desviación estándar la curva se baja aplastándose o se alza haciéndose angosta si se aumenta o disminuye respectivamente.
65
Distribución Normal f x (x)f x
66
Distribución Normal f x (x) =0.5 =2 =1 f x (x) =0.5 =2 =1
67
Distribución Lognormal Una distribución lognormal resulta del producto de muchas variables independientes multiplicadas juntas, es muy utilizada en el análisis de problemas ambientales con el objeto de representar datos positivos de magnitudes pequeñas. Hay tres formas comunes de parametrizar una variable lognormal: a) promedio aritmético del logaritmo de variables descritas por una distribución normal. b) promedio geométrico de variables no transformadas. c) promedio aritmético de variables no transformadas. Sus expresiones matemáticas están dadas por:
68
Lognormal de dos parámetros Lognormal de tres parámetros
69
Distribución Weibull Una distribución weibull es muy utilizada en el análisis de supervivencia y fallos en el tiempo. Sus expresiones matemáticas están dadas por: Weibull con dos parámetros Weibull con tres parámetros
70
Distribución Gamma Una distribución gamma es muy utilizada en los análisis de medio ambiente para caracterizar concentraciones de contaminantes, procesos meteorológicos y en la caracterización de la precipitación. Sus expresiones matemáticas están dadas por: Gamma con dos parámetros Gamma con tres parámetros
71
Otras técnicas estadísticas aplicadas en el análisis de datos ambientales Estadística Bayesiana Pruebas de hipótesis parametricas y no parametricas Series de tiempo Bondad de ajuste Técnicas Multivariadas
72
Bibliografía Wayne R. Ott. Environmental Statistics and data Analisis. Lewis, 1995 Edward A. McBean & Frank A. Rovers. Statistical Procedures for Analysis of Environmental Monitoring Data & Risk Assessment. Prentice Hall PTR, 1998 A.T. Walden & P. Guttorp. Statistics in the Environmental & Earth Sciences. 1992 Richard O. Gilbert. Statistical Methods for Environmental Pollution Monitoring. Van Nostrand Reinhold, 1987 Mary Lou Thompson, Joel Reynolds, Lawrence H. Cox, Peter Guttorp, Paul D. Sampsin. A review of statistical methods for the meteorological adjusment of tropospheric ozone. Technical Report Series
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.