INSTITUTO NACIONAL DE ECOLOGÍA DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN URBANA REGIONAL Y GLOBAL DIRECCIÓN DE INVESTIGACIÓN SOBRE LA CALIDAD.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Estadística I. Finanzas Y Contabilidad
Las distribuciones binomial y normal.
Estadística Unidad III
ESTADÍSTICA DESCRIPTIVA
ESTADISTICA INFERENCIAL
Variable Aleatoria Continua. Principales Distribuciones
FRANCISCO JAVIER RODRÍGUEZ
La prueba U DE MANN-WHITNEY
KRIGING.
4. 0 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 4
Estimación por Intervalos de confianza
MEDIDAS DE DISPERSIÓN:
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Universidad Mexicana en Línea Carrera: Administración Pública Asignatura: Estadística Tutor: Leonardo Olmedo Alumno: Alfredo Camacho Cordero Matrícula:
Licenciatura en Administración Pública
8.3.- APROXIMACIOIN DE LA DISTRIBUCION BINOMIAL A LA NORMAL
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
Pronósticos, Series de Tiempo y Regresión
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
Mt. Martín Moreyra Navarrete.
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Tema 6: Modelos probabilísticos
Distribuciones de probabilidad
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
Valor que toma la variable aleatoria
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 2: Parámetros Estadísticos
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Coeficiente de Variación
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Medidas de Posición y Centralización Estadística E.S.O.
SEMINARIO DE INVESTIGACIÓN IV Y TRABAJO DE GRADO
Maestría en Transporte Estadística Capítulo 1. Objetivos ¿Cómo se determinan las magnitudes para planificación de transporte, operación de transporte,
Inferencia Estadística
Tratamiento de datos y azar
Herramientas básicas.
Unidad II: Variables Aleatorias Concepto Discreta y Continua Fun. de densidad Fun. de probabilidad F. de distribución Esperanza y Varianza Propiedades.
¿QUÉ ES LA ESTADÍSTICA? La estadística es una disciplina que diseña los procedimientos para la obtención de los datos, como asimismo proporciona las herramientas.
Unidad V: Estimación de
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Teoría de Probabilidad Dr. Salvador García Lumbreras
Distribuciones probabilísticas discretas
Elementos Básicos de Probabilidad y Estadística
Métodos Cuantitativos
SESION 5: MEDIDAS DE FORMA. Hasta el momento nos hemos enfocado en el análisis de datos a partir de los valores centrales y la variabilidad de las observaciones.
Estimación y contraste de hipótesis
Aplicaciones Estadísticas a las Finanzas Clase 1
ESTIMACIÓN DE PARÁMETROS
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
Distribuciones de Probabilidad
P y E 2012 Clase 15Gonzalo Perera1 Repaso de la clase anterior. Métodos de estimación.
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
INFERENCIA ESTADÍSTICA
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
Aplicaciones Estadísticas a las Finanzas Clase 1
Coeficiente de variación
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Estadística descriptiva
Medidas de tendencia central
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
Transcripción de la presentación:

INSTITUTO NACIONAL DE ECOLOGÍA DIRECCIÓN GENERAL DE INVESTIGACIÓN SOBRE LA CONTAMINACIÓN URBANA REGIONAL Y GLOBAL DIRECCIÓN DE INVESTIGACIÓN SOBRE LA CALIDAD DE AIRE Ma. Guadalupe Tzintzun Cervantes

IMECA Frecuencia TALLER DE “CALIDAD DEL AIRE Y RED DE MONITOREO AMBIENTAL” Identificación e implementación de técnicas estadísticas para el análisis de la información de calidad del aire y estimación de pronósticos Bógota-Colombia

Métodos Estadísticos para el Análisis de Datos de Calidad del Aire Existe más de una técnica estadística para un determinado análisis de la información de Calidad del Aire y en cada técnica se hacen suposiciones que pueden o no ser apropiadas para las circunstancias especificas del problema a resolver.

Análisis exploratorio de los datos  Análisis gráfico de los datos  Características de los datos a través del uso de estadísticas descriptivas El análisis exploratorio de los datos permite aparte de visualizar la estructuras, comportamientos y relaciones de las variables bajo estudio, verificar su calidad, cantidad y consistencia.

Análisis gráfico de los datos Una excelente gráfica estadística es aquella que comunica ideas complejas con claridad, precisión y eficiencia. Al desplegar una gráfica se quiere lo siguiente:  Mostrar los datos  Evitar distorsionar lo que los datos dicen  Presentar un conjunto de datos en un pequeño espacio  Hacer coherente un conjunto de datos grande  Los datos revelen niveles de detalle a simple vista

Histograma El histograma es el más común, para dibujarlo se parte de una tabla de frecuencias o distribución de frecuencias en la cual se organizan y distribuyen los posibles valores de una variable. Frecuencia por hora de los máximos diarios de ozono que exceden 0.11, 0.15, 0.2, 0.25 y 0.3 ppm en la ZMVM,

Histograma de los máximos diarios de ozono que exceden 0.11 ppm en la ZMVM

Gráficas en el tiempo Con este tipo de gráficas es posible visualizar el comportamiento (o patrón) del fenómeno de interés a lo largo del tiempo para determinar algún tipo de tendencia: cíclica, periodica, etc. Comportamiento de las PM10 del 1 al 5 de enero de 1998 en la ZMVM

Gráficas de dos escalas Son otro tipo de gráficas en el tiempo, cuya característica principal es visualizar dos variables con diferentes unidades de medición, lo cual permite determinar posibles relaciones en el tiempo entre ellas. Comportamiento del Ozono y la Temperatura el 1 de enero de 1998 en la ZMVM

Gráficas de dispersión Este tipo de gráficas son utiles para visualizar posibles asociaciones entre dos variables. Es necesario contar con información bivariada. Existen diferentes tipos de asociación, entre los principales se encuentran: asociación lineal directa, lineal inversa, curvilínea directa y curvilínea inversa. Asociación lineal. Este tipo de asociación gráficamente se representa por medio de una línea recta. Asociación curvilínea. Este tipo de asociación gráficamente se representa por medio de una línea curva. Asociación directa. A medida que una de las variables incrementa sus valores, la otra variable también. Asociación inversa. A medida que una de las variables incrementa sus valores, la otra variable decrementa los suyos.

Gráfica de dispersión de contaminantes criterio y variables meteorologicas del 1 de enero de 1998 en la ZMVM

Gráficas de Caja Comparación anual de la máximos diarios de Ozono en las principales ciudades de la República Mexicana ZMVM ZMG Juárez Mexicali ZMM Tijuana ZMVT N = IMECA Comparación del máximo diario de Ozono en 1998 de las principales ciudades de la República Méxicana Con este tipo de gráficas es posible determinar visualmente un resumén de los datos ya que proporciona el rango, el rango intercuantilico, la mediana y las estadísticas de orden de la variable de interés.

Mapas de datos Con los mapas se despliega un conjunto de datos muy grande en el espacio, la impresión visual de los datos se conjunta con los límites geográficos de la zona a la que pertenecen.

Distribución Espacial de Ozono en la ZMVM el día 20 de Mayo de 1998 hora a hora Menor concentración de Ozono

01:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

02:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

03:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

04:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

05:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

06:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

07:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

08:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

09:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

10:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

11:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

12:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

13:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

14:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

15:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

16:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

17:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

18:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

19:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

20:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

21:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

22:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

23:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

24:00 hrs. TLA XAL TAC LAG MER CE NO NE CUA PED UIZ CES TAX SE SO TAH TPN PLA HAN BJU CHA SAG EAC AZC

Estadísticas Descriptivas En algunas investigaciones se obtienen numerosos datos que deben reducirse para lograr una interpretación adecuada. En estas situaciones la estadística descriptiva es utilizada como un valioso instrumento de análisis para describir y analizar las características de las observaciones y sobre las relaciones que existen con las características de otros conjuntos con los que se compare. Las estadísticas descriptivas más comunes caen basicamente dentro de tres grupos:  Medidas de tendencia central o localización  Medidas de dispersión  Medidas de la forma de la distribución

Medidas de tendencia central o localización Con estas medidas podemos ubicar en qué valor se centran las observaciones y las más usuales son:  media aritmética (promedio)  mediana  Moda  cuartiles, deciles, percentiles (cuantiles)  media geométrica  media armónica

Medidas de dispersión Esta medida indica que tanto se alejan los datos de una medida central especifica, la más común es la media y las más usuales son:  Rango  Rango intercuantilico  Varianza  Desviación estándar  Coeficiente de correlación

Medidas de la forma de la distribución Para estudiar la forma de la distribución de una variable se necesita disponer de un número de observaciones lo suficientemente grande como para poder deducir la regularidad o forma general del comportamiento de los valores observados. El histograma permite describir la forma de la distribución. De la visualización de este gráfico puede deducirse si los valores observados están o no muy concentrados en pocos valores de la variable, si la concentración se produce en el centro del recorrido de la variable o en uno de los extremos. Dos de estas medidas son:  sesgo  curtósis

Estadísticas descriptivas de las concentraciones (ppm) máximas diarias de ozono de cinco estaciones de monitoreo* en la ZMVM *Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella

Tendencia histórica de los máximos diarios de ozono de cinco estaciones de monitoreo* en la ZMVM *Máximo diario de Tlalnepantla (TLA), Xalostoc (XAL), Merced (MER), Pedregal (PED) y Cerro de la Estrella

Funciones de distribución (Modelos de Probabilidad) IMECA Frecuencia El análisis gráfico y las estadísticas descriptivas muestran diferentes comportamientos en la forma de la distribución de la variable. Estas formas pueden lleva a asociaciones preliminares de la distribución de la variable con algunos modelos matemáticos, de los que se conocen propiedades que permiten realizar un análisis más científico del comportamiento de variable. A este tipo de modelos se les conoce como funciones de distribución.

Funciones de distribución (Modelos de Probabilidad) Las funciones de distribución se clasifican en discretas y continuas, esta clasificación depende de que la variable sea discreta o continua. Es discreta cuando sólo pueden tomar algunos valores en un intervalo y no es posible que llegue a tomar algún valor entre dos números y continua cuando puede tomar cualquier valor dentro de un intervalo. Por lo que para asociarle una función de distribución a una variable se debe considerar el rango de valores que esta puede tomar.

Funciones de distribución discretas Si x es una variable discreta que puede tomar distintos valores la función denotada por f x (x) y definida como es llamada la función de densidad de x donde es la probabilidad de que x tome el valor de. De la función de densidad discreta de x se puede obtener la función de distribución de x, como se muestra a continuación

Funciones de distribución discretas Una función de densidad discreta satisface los siguientes tres puntos: a) b) c) Donde la suma es sobre todos los valores de La variable x.

Funciones de distribución discretas El valor esperado o media (  =E (x)), se define como La varianza, la cual es una medida de dispersión con respecto al valor esperado, se define como: La desviación estándar, al igual que la varianza mide que tanto se alejan los valores de la variable de la media y se define como :

Distribución Bernoulli Considérese un experimento donde el resultado sólo puede tener dos opciones "éxito" o "fracaso", esto es, la variable x puede tomar los valores X= 1, si se tiene éxito X = 0, si no se tiene éxito Ahora bien, sea el experimento es modelado con la función de distribución Bernoulli, cuya expresión matemática esta dada por: El valor esperado y la varianza para la distribución Bernoulli están dadas por µ = p y  2 = p(1-p)

Distribución Binomial Cuando el experimento anterior se realiza n veces de manera independiente, los valores de la variable pueden ser 0,1,2,....., n éxitos, esto es hay x resultados con éxito y n-x resultados en los que no se tiene éxito, y se modela con la función de distribución Binomial, cuya expresión matemática para la densidad esta dada por, Su media y varianza están dadas por µ = np y  2 = np(1-p)

Distribución Poisson En ciertas aplicaciones en las cuales se modela con la distribución binomial con frecuencia, el valor de p es pequeño y el de n grande (mayor que 50). En estos casos la distribución binomial puede aproximarse con la función de distribución Poisson cuya expresión matemática esta dada por: µ = y  2 =

Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire El número de excedencias a la norma de un determinado contaminante digamos NO 2, puede ser tratado como un proceso Bernoulli, ya que cada valor máximo diario se compara con el valor de la norma para ver si este se rebasa o no, y por tanto se puede aplicar la distribución Binomial. Para poder aplicar este modelo se supone que las excedencias de NO 2 son eventos independientes, dado que al considerarse los valores máximos diarios, se rompe la relación entre ellos, los 365 días del año pueden suponerse 365 eventos independientes Bernoulli.

Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire Para eventos históricos se sabe que el número de excedencias al año de NO 2 es aproximadamente de 3, esto es, en promedio el número de días que se excede la norma de NO 2 es 3. Esto es, el número de excedencias al año se modela con una distribución Binomial con n =365 y p =3/365, ya que por inferencia estadística es bien conocido que p se estima con Al aproximar utilizando la distribución Poisson considerando p pequeño y n grande se tiene que  3 y el modelo queda dado por

Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire Una vez que se tiene el modelo es válido preguntarnos por la probabilidad de 4 excedencias en el año. Lo anterior es muy fácil de calcular se puede hacer el calculo directo o bien recurrir a tablas. Utilizando notación matemática, la pregunta se traduce a Esto es, la probabilidad de que haya 4 excedencias de NO 2 en un año es de Si nos preguntamos por a lo más 4 excedencias, la probabilidad esta dada por

Una aplicación de las distribuciones discretas anteriores a un problema de Calidad del Aire

Funciones de distribución continuas La función de densidad continua f x (x) se representa con una curva continua tal que el área incluida bajo la curva es 1 esto es área =1

Funciones de distribución continuas La densidad f x (x) se obtiene para calcular áreas entre dos valores. Si f x (x) es la función de densidad de una variable continua, se obtiene la función de distribución F x (x) para un valor de la variable x como: De manera similar Para un rango particular de la variable x, digamos

Funciones de distribución continuas En el caso de una variable continua el valor esperado y la varianza de x están dados por:

Distribución Uniforme Continua Supongamos que x es una variable aleatoria continua que toma los valores en el intervalo [a,b], donde ambos a y b son finitos. Si la dese dice que x esta distribuida uniformemente en el intervalo [a,b]. Si la densidad de x esta dada por se dice que x esta distribuida uniformemente en el intervalo [a,b] El valor esperado y la desviación estándar para una variable que sigue una distribución uniforme están dados por

Simulación Monte Carlo La distribución Uniforme es útil para generar variables aleatorias continuas con una distribución especifica. Supongase que X se distribuye bajo una función de probabilidad conocida. Sabemos que, esto es U = F(x) sigue una distribución Uniforme [0,1], por lo que la transformación inversa de F(x), tendrá la distribución deseada. Si la expresión no se puede resolver analíticamente, es posible obtener algoritmos en la computadora que la aproxime

Distribución Normal El modelo de distribución normal es el resultado de la suma de muchas otras variables aleatorias continuas no relacionadas. Considérese un modelo idealizado en el cual X 1, X 2,..., X n son variables aleatorias independientes con una distribución común con media  o = 0 y varianza  2 = 1. Utilizando el Teorema de Limite Central, la variable Z tiende a distribuirse como una normal en el límite cuando n es grande. La distribución normal estandarizada tiene la siguiente expresión matemática:

Distribución Normal Esta función de densidad es simétrica con respecto del cero y tiene forma acampanada. Su función de distribución acumulativa esta dada por: Esta integral no puede ser evaluada analíticamente, pero existen tablas para su evaluación.

Distribución Normal La expresión de la distribución normal no estandarizada alrededor de la media esta dada por la siguiente expresión matemática Para diferentes valores del valor esperado y la desviación estándar, la curva de distribución normal asume formas distintas, pero siempre del mismo tipo de campana. Variando sólo la media, la curva se desplaza, conservando la misma forma a la derecha ó a la izquierda. Si se varia la desviación estándar la curva se baja aplastándose o se alza haciéndose angosta si se aumenta o disminuye respectivamente.

Distribución Normal f x (x)f x 

Distribución Normal f x (x) =0.5 =2 =1 f x (x) =0.5 =2 =1    

Distribución Lognormal Una distribución lognormal resulta del producto de muchas variables independientes multiplicadas juntas, es muy utilizada en el análisis de problemas ambientales con el objeto de representar datos positivos de magnitudes pequeñas. Hay tres formas comunes de parametrizar una variable lognormal: a) promedio aritmético del logaritmo de variables descritas por una distribución normal. b) promedio geométrico de variables no transformadas. c) promedio aritmético de variables no transformadas. Sus expresiones matemáticas están dadas por:

Lognormal de dos parámetros Lognormal de tres parámetros

Distribución Weibull Una distribución weibull es muy utilizada en el análisis de supervivencia y fallos en el tiempo. Sus expresiones matemáticas están dadas por: Weibull con dos parámetros Weibull con tres parámetros

Distribución Gamma Una distribución gamma es muy utilizada en los análisis de medio ambiente para caracterizar concentraciones de contaminantes, procesos meteorológicos y en la caracterización de la precipitación. Sus expresiones matemáticas están dadas por: Gamma con dos parámetros Gamma con tres parámetros

Otras técnicas estadísticas aplicadas en el análisis de datos ambientales  Estadística Bayesiana  Pruebas de hipótesis parametricas y no parametricas  Series de tiempo  Bondad de ajuste  Técnicas Multivariadas

Bibliografía Wayne R. Ott. Environmental Statistics and data Analisis. Lewis, 1995 Edward A. McBean & Frank A. Rovers. Statistical Procedures for Analysis of Environmental Monitoring Data & Risk Assessment. Prentice Hall PTR, 1998 A.T. Walden & P. Guttorp. Statistics in the Environmental & Earth Sciences Richard O. Gilbert. Statistical Methods for Environmental Pollution Monitoring. Van Nostrand Reinhold, 1987 Mary Lou Thompson, Joel Reynolds, Lawrence H. Cox, Peter Guttorp, Paul D. Sampsin. A review of statistical methods for the meteorological adjusment of tropospheric ozone. Technical Report Series