Juan Camilo Montoya Universidad Sergio Arboleda Dic, 2012

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Introducción a la Estadística
“AVALIAÇÃO DE GRANDES PROJETOS PÚBLICOS”
Las distribuciones binomial y normal.
Variable Aleatoria Continua. Principales Distribuciones
Bioestadística Distribución Normal
Matemáticas aplicadas a las CCSS II Ana Pola IES Avempace
Distribuciones de Probabilidad Conceptos relacionados
Curso de actualización en Ingeniería de calidad
Binomial Poisson Hipergeométrico Modelos Discretos
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
La ley de los grandes números
ANTECEDENTES DE ESTADÍSTICA PARA LA INVESTIGACIÓN: 3
SIMULACION MONTE CARLO CON MS EXCEL
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
1.2 Variables aleatorias..
Estimación por Intervalos de confianza
Uso de pruebas estadísticas paramétricas y no paramétricas
Distribuciones de Probabilidad
GRADO DE CONFIANZA DE LA INFERENCIA
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
1 M. en C. Gal Vargas Neri. ESTADISTICA I CSH, Tema III TEMARIO.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Estadística Descriptiva
Universidad Mexicana en Línea Carrera: Administración Pública Asignatura: Estadística Tutor: Leonardo Olmedo Alumno: Alfredo Camacho Cordero Matrícula:
Licenciatura en Administración Pública
Control estadístico de Proceso
PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES
MATEMÁTICA APLICADA FACILITADOR: LCDO. ALFREDO MEDINA INTEGRANTES:
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
Distribuciones de probabilidad
DISTRIBUCIÓN NORMAL La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas,
DISTRIBUCIONES DE MUESTREO
Unidad V: Estimación de
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
AGENDA Distribuciones de probabilidad discreta
ESTADÍSTICAS DESCRIPTIVA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Inferencia Estadística
Estadística para administradores
Función Densidad Continua (o distribución de probabilidad continua)
Principales distribuciones discretas
Herramientas básicas.
Variables aleatorias y sus distribuciones
PROBABILIDAD CONCEPTO.
Unidad V: Estimación de
Repaso de clase anterior
TEMA II Estimaciones y Distribuciones
Líneas de Espera: Teoría de Colas
Estimaciones y Distribuciones. BIOMETRIA I2 Estadística: Es la ciencia, pura y aplicada que crea, desarrolla y aplica técnicas de modo que pueda evaluarse.
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
Modelación de Datos de Entrada
Teoría de Probabilidad Dr. Salvador García Lumbreras
Estadística Aplicada Descripción del Curso Este curso trata sobre la presentación de modelos Probabilísticos y Estadísticos aplicados en las distintas.
Líneas de Espera: Teoría de Colas
Estimación y contraste de hipótesis
Fecha de entrega: 21/09/11. La Teoría de Colas es el estudio de la espera en las distintas modalidades. El uso de los modelos de colas sirve para representar.
Aplicaciones Estadísticas a las Finanzas Clase 1
Alicia De Gyves López Licenciatura Tecnologías de la Información y Comunicación 3º. Cuatrimestre Estadística Descriptiva Distribuciones de Probabilidad.
Alumno: Hebert Rangel Gutierrez Matricula: Tutor: Leonardo Olmedo Asignatura: Estadistica Descriptiva Licenciatura en Tecnologías de la Información.
Distribuciones de Probabilidad
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
INFERENCIA ESTADÍSTICA
Distribuciones de Probabilidad Discretas Las distribuciones discretas que se tratarán son: 1.Binomial 2.Multinomial 3.Hipergeométrica 4.Hipergeométrica.
Aplicaciones Estadísticas a las Finanzas Clase 1
INTERVALO DE CONFIANZA
Transcripción de la presentación:

Juan Camilo Montoya Universidad Sergio Arboleda Dic, 2012 Monte Carlo Simulación Juan Camilo Montoya Universidad Sergio Arboleda Dic, 2012

Que es? Método computacional iterativo usado para estudiar sistemas matemáticos, físicos o de cualquier índole, y encontrar soluciones aproximadas a problemas cuantitativos a partir del muestreo estadístico y los números aleatorios.

Por que Simular? Complejidad de los problemas Imposibilidad de encontrar soluciones analíticas Variables dinámicas en el tiempo: procesos estocásticos. Para derrotar al casino??

La casa Siempre Gana!

Orígenes Se atribuye a Stanislaw Ulam, matemático polaco. Ulam no inventó el muestreo estadístico, pero trabajando con John von Neuman y Nicholas Metropolis reconoció la el potencial de los computadores electrónicos para automatizar y aprovechar el proceso. Ulam y Metropolis publican el primer paper en 1949.

En este curso, usaremos la simulación Monte Carlo para el tratamiento de problemas y modelos con incertidumbre. Partiremos de modelos matemáticos que describan un problema o situación y que incorporen componentes probabilísticos.

= Variabilidad Total Riesgo + Incertidumbre Hay 2 componentes de aleatoriedad en un modelo: efecto aleatorio propio del sistema bajo análisis. Se puede reducir alterando el sistema. Riesgo nivel de ignorancia del evaluador acerca de los parámetros del sistema. Se puede reducir a veces con mediciones adicionales mayor estudio, o consulta a expertos. + Incertidumbre = Variabilidad Total

Tanto el riesgo como la incertidumbre se describen mediante…

…Variables Aleatorias

Para que modelar la variabilidad? El riesgo no es algo que se "sufre", el riesgo es algo que se puede administrar.

Administración del Riesgo Negociar las variables negociables Buscar más información Aumentar el compromiso Tomar precauciones adicionales Compartir el riesgo Transferir el riesgo Formular planes de contingencia No tomar medidas, asumir el riesgo Cancelar el proyecto Muchas de estas respuestas al riesgo generan a su vez riesgos secundarios. Se aumenta el compromiso cuando el análisis muestra que se está siendo excesivamente cauteloso. Se busca más información cuando se quiere reducir la incertidumbre. Precauciones adicionales pueden ser medidas tales como un enfoque menos riesgoso o sobredimensionamiento. Se comparten los riesgos con quienes puedan manejar un posible impacto adverso. Los planes de contingencia debieran desarrollarse para manejar riesgos que se identifican pero no se eliminan, de modo de poder reaccionar en forma efectiva en caso que se presente la adversidad. No se hace nada cuando costaría demasiado hacer algo, o no hay nada que pueda razonablemente hacerse, se asume el riesgo.

Simulación Monte Carlo 1. Diseñar el modelo matemático que representa el problema con incertidumbre. 2. Especificar distribuciones de probabilidad para las variables aleatorias relevantes. 3. Incluir posibles dependencias entre variables. 4. Muestrear valores de las variables aleatorias. 5. Calcular el resultado del modelo según los valores del muestreo y registrar el resultado. 6. Repetir el proceso iterativamente hasta tener una muestra estadísticamente representativa. 7. Obtener la distribución de frecuencias del resultado de las iteraciones. 8. Calcular media, desvío y curva de percentiles acumulados. El análisis de escenarios tiene las siguientes limitaciones: Las combinaciones crecen exponencialmente cuantas más variables aleatorias haya en juego. Definir la aleatoreidad de cada variable como valores con probabilidades discretas ignora la posibilidad que las variables sean de tipo continuo. No tiene en cuenta que los valores más probables tienen una probabilidad de ocurrencia mucho mayor que los extremos. Montecarlo genera una serie de escenarios posibles, pero tiene en cuenta todos los valores que una variable puede tomar y pondera cada escenario por su probabilidad de ocurrencia.

Analisis de escenarios Debido a que la simulación involucra la generación de un numero alto de escenarios, puede ser entendida como una forma mas completa de realizar análisis de escenarios o análisis What-if What-if El análisis de escenarios tiene las siguientes limitaciones: Las combinaciones crecen exponencialmente cuantas más variables aleatorias haya en juego. Definir la aleatoreidad de cada variable como valores con probabilidades discretas ignora la posibilidad que las variables sean de tipo continuo. No tiene en cuenta que los valores más probables tienen una probabilidad de ocurrencia mucho mayor que los extremos. Montecarlo genera una serie de escenarios posibles, pero tiene en cuenta todos los valores que una variable puede tomar y pondera cada escenario por su probabilidad de ocurrencia. What-if What-if What-if What-if What-if What-if What-if

Fundamentos de probabilidad para simulación.

Fundamentos de probabilidad para simulación. Variables Aleatorias Distribuciones de probabilidad Ley de los grandes números. Teorema del límite central.

Fundamentos de probabilidad para simulación. Variables Aleatorias Distribuciones de probabilidad Ley de los grandes números. Teorema del límite central.

Variables Aleatorias Una Variable aleatoria X es una función cuyos valores son números reales y dependen del “azar”. Para caracterizar las variables aleatorias se utilizan las distribuciones de probabilidad.

Fundamentos de probabilidad para simulación. Variables Aleatorias Distribuciones de probabilidad Ley de los grandes números. Teorema del límite central.

Distribución de probabilidad Una distribución de probabilidad describe el rango de valores que puede tomar una variable aleatoria y la probabilidad asignada a cada valor o rango de valores.

Distribuciones de probabilidad Discretas Una variable aleatoria representada mediante una distribución discreta de probabilidad puede tomar un valor de entre un conjunto de valores, cada uno de los cuales tiene asignada una determinada probabilidad de ocurrencia.

Distribuciones de probabilidad Continuas Una variable aleatoria representada mediante una distribución continua de probabilidad puede tomar cualquier valor dentro de un rango determinado. Se usan para representar propiedades que son infinitamente divisibles (tiempo, distancia, masa) o variables discretas en las que el intervalo entre valores factibles es irrelevante en la práctica.

Distribuciones de probabilidad No Limitadas La variable aleatoria puede tomar valores entre +infinito y –infinito Limitadas Los valores de la variable aleatoria quedan confinados entre dos valores extremos Parcialmente Limitadas Los valores de la variable aleatoria quedan limitados en uno de los extremos de la distribución.

Distribuciones de probabilidad Paramétricas La distribución de probabilidad se ajusta a la descripción matemática de un proceso aleatorio que cumple con determinados supuestos teóricos. Los parámetros que definen la distribución en general no guardan relación intuitiva con la forma de la distribución. Ejemplos: Normal, Lognormal, Exponencial, Beta.

Distribuciones de probabilidad No Paramétricas Los parámetros que se usan para definir estas distribuciones describen la forma de la distribución. No se apoyan en una teoría que describa el proceso de generación de valores aleatorios. Ejemplos: Triangular, Histograma, General, Uniforme, Acumulada

Distribuciones de probabilidad Subjetivas El uso de estas distribuciones de probabilidad es la única alternativa para describir una variable aleatoria cuando: 1. No hay una base de antecedentes. 2. Los datos del pasado no son relevantes. 3. Los datos son escasos y no cubren todo el rango de posibles valores. 4. Es demasiado caro generar datos. 5. Generar valores llevaría demasiado tiempo

DISTRIBUCIONES NO PARAMETRICAS

Uniforme Todos los valores dentro del rango factible tienen la misma densidad de probabilidad. Parámetros : Uniform (min,max) Aplicaciones: U(0,1) se usa en la generación de los valores de todas las demás distribuciones de probabilidad en el muestreo aleatorio. Es una aproximación muy cruda para usar como estimación de la incertidumbre percibida de un parámetro Uniform (0,l/2) se puede usar para estimar la distribución de la distancia entre una filtración y una junta en una cañería. Uniform (0,360) puede usarse para estimar la distribución de una posición angular de descanso de un mecanismo giratorio

Ejemplos: Uniform (0,l/2) se puede usar para estimar la distribución de la distancia entre una filtración y una junta en una cañería. Uniform (0,360) puede usarse para estimar la distribución de una posición angular de descanso de un mecanismo giratorio

Triangular Aplicaciones: estimar subjetivamente la distribución de la variable aleatoria cuando todo lo que puede precisarse de la misma es el valor mínimo, el valor más probable y el valor máximo. Parámetros: Triang (min, +prob, max)

Triangular (cont.) Sus propiedades estadísticas se derivan de su forma, no de una teoría subyacente. Es de definición intuitiva y de gran flexibilidad en cuanto a geometrías posibles. La forma de la distribución usualmente lleva a sobreestimar la densidad de las colas y a subestimar la densidad en el “tronco” de la distribución. Media : (a+b+c)/3 Desvío: ((a2 +b2 +c2 - ab - ac - bc) / 18)1/2 Por TCL, cuando se suman una cantidad de variables aleatorias, son la media y el desvío de las distribuciones las que tienten el mayor impacto por ser las que determinan la media y el desvío del resultado. La distribución triangular, al dar el mismo peso en la determinación de la media y el desvío de la distribución a los tres parámetros, puede llevar a distorsiones cuando alguno de los valores extremos no está bien definido o toma valores muy altos.

Discreta Aplicaciones: Parámetros: Discrete ({xi},{pi}) 1. Describir una variable aleatoria que puede tomar uno de entre un conjunto de valores discretos. 2. Describir probabilidades condicionales para distintos estados de la naturaleza, donde cada estado de la naturaleza tiene una probabilidad de ocurrencia p. 3. Armar distribuciones de probabilidad compuestas a partir de la opinión de dos o más expertos, donde a la opinión de cada experto se le otorga una ponderación p. Parámetros: Discrete ({xi},{pi})

Histograma Histograma Aplicaciones: representar la forma de la distribución de una serie de datos o la opinión de un experto acerca de la forma de la distribución de una variable. Parámetros: Histogram (min, max, {pi}) Todos los intervalos de la distribución tienen el mismo “ancho”.

DISTRIBUCIONES PARAMETRICAS

Normal La mayoría de las variables aleatorias que se presentan en los estudios relacionados con las ciencias sociales, físicas y biológicas, son continuas y se distribuyen según la distribución de probabilidad Normal, que tiene la siguiente expresión analítica : Donde μ es la media de la variable aleatoria y σ es su desviación típica.

Normal La distribución de probabilidad Normal, tiene forma de campana Para una variable aleatoria X, que se distribuye normalmente con media : μ y desviación típica : σ, la probabilidad de que la variable X esté comprendida entre los valores a y b es el área teñida de rojo en la siguiente figura

Esta probabilidad analíticamente se puede calcular así: Como el cálculo de esta integral es laborioso, para calcular el área se realiza el siguiente cambio de variable:

Este cambio origina una distribución normal estándar de media μ = 0 y desviación típica σ = 1 cuya función de densidad es :

Ejemplos: En todos los campos de las ciencias empíricas: biología, medicina, psicología, física, economía, etc. En particular, muchas medidas de datos continuos en medicina y en biología (talla, presión arterial, etc.)

Estimación subjetiva de los parámetros de una Normal Media: Valor más probable Desvío: el intervalo +/- 2*sigma contiene el 95% de los valores, por lo tanto: Sigma: (máximo - más probable) / 2 La distribución Normal Truncada muestrea de una distribución Normal con parámetros (mu,sigma) pero no registrará los valores que estén más allá del mínimo y el máximo indicados.

Lognormal Aplicaciones: modelar variables que son el producto de una cantidad de otras variables aleatorias que ocurren naturalmente. Generalmente brinda una buena representación de variables que se extienden de 0 a +inf y que tienen un sesgo positivo. Parámetros: Lognormal (mu,sigma) Se usan como parámetros la media aritmética y el desvío standard de los datos disponibles. Los precios de las acciones tienen un sesgo positivo porque su valor mínimo no puede ser menor que 0 pero su valor máximo no tiene límite teórico.

Condiciones subyacentes La variable aleatoria puede tomar valores que aumentan sin límites pero no puede tomar valores negativos. La variable aleatoria tiene un sesgo positivo (modo < media) con la mayor parte de los valores cerca del límite inferior. El logaritmo natural de la variable se ajusta a una distribución Normal.

Ejemplos: es útil para modelar datos de numerosos estudios médicos tales como: el período de incubación de una enfermedad los títulos de anticuerpo a un virus El tiempo de supervivencia en pacientes con cáncer o SIDA, etc.

Distribuciones de probabilidad para Procesos estocasticos Discretos Un Proceso Discreto se caracteriza por una probabilidad p de ocurrencia de un evento discreto en cada prueba.

Binomial Aplicaciones: estimar la distribución de la cantidad s de ocurrencias de un evento en n pruebas, cuando hay una probabilidad p de ocurrencia del evento en cada prueba. Parámetros: Binomial (n,p) La distribución Bernouilli es un caso especial de la distribución Binomial cuando n=1. La distribución Binomial se relaciona con la distribución Beta: Binomial estima el número de ocurrencias s en n pruebas cuando hay una probabilidad de éxito p en cada prueba, Beta estima el valor de p dados n y s.

Ejemplo: Utilizada frecuentemente en control de calidad. p representa la fracción de items defectuosos. X representa el número de artículos defectuosos encontrados cuando se toma una muestra al azar de tamaño n.

Distribución Hipergeométrica Al igual que la distribución Binomial, esta distribución describe la cantidad de ocurrencias de un evento en una cantidad de pruebas. La diferencia con la distribución Binomial es que a medida que se avanza con las pruebas cambia la probabilidad de ocurrencia del evento: pruebas sin reemplazo.

Ejemplo: Combinación de eleméntos de dos fuentes distintas. EJ: Un lote de tuberías está compuesto por 100 partes nacionales y 200 importadas. Si se seleccionan al azar 4 partes, cual es la probabilidad de que todas sean nacionales?

Geométrica Aplicaciones: estimar la cantidad n de pruebas necesarias hasta la ocurrencia del primer evento, cuando la probabilidad p de ocurrencia de un evento se mantiene constante en el tiempo. La distribución Geométrica es análoga a la distribución Exponencial: Geométrica se aplica a variables discretas, Exponencial se aplica a variables continuas. La distribución geométrica es un caso especial de Binomial Negativa, donde s=1. La distribución geométrica está muy sesgada hacia la derecha. p(0) = p, indicando que la probabilidad que no haya fallas es igual a p, lo que es la probabilidad que el primer intento resulte un éxito.

Ejemplos: La cantidad de intentos que de deben realizar en un proceso industrial con incertidumbre antes de obtener el resultado deseado. Cantidad de niños varones que se van a tener antes de tener una niña.

Binomial Negativa (Pascal) Aplicaciones: estimar la distribución de la cantidad n de pruebas hasta que ocurran s eventos, cuando la probabilidad p de ocurrencia de un evento es constante en el tiempo. Cuando s=1, la distribución binomial negativa se vuelve una geométrica. A medida que s aumenta y p no asume valores extremos, la Binomial Negativa se aproxima a una Normal

Ejemplos: Si la probabilidad de que un niño expuesto a una enfermedad contagiosa la contraiga es 0,40, ¿cuál es la probabilidad de que el décimo niño expuesto a la enfermedad sea el tercero en contraerla? En un proceso de manufactura se sabe que un promedio de 1 en cada 10 productos es defectuoso, ¿cual es la probabilidad que el quinto (5) articulo examinado sea el primero (1) en estar defectuoso? Cuando s=1, la distribución binomial negativa se vuelve una geométrica. A medida que s aumenta y p no asume valores extremos, la Binomial Negativa se aproxima a una Normal

Distribuciones de probabilidad para Procesos Continuos Un Proceso Continuo se caracteriza por un Intervalo Medio de Tiempo entre Eventos (beta).

Poisson Aplicaciones: estimar la cantidad N de ocurrencias de un evento en un intervalo de tiempo T cuando el tiempo medio entre eventos sucesivos (beta) se ajusta a un proceso tipo Poisson. Lambda = 1 / beta, se puede interpretar como la cantidad promedio de ocurrencias del evento por unidad de exposición. A medida que p tiende a 0, un Proceso Binomial se vuelve un Proceso Poisson. Cuando p es baja y n es suficientemente grande (np<1), la distribución Binomial (n,p) puede ser aproximada por una distribución Poisson (lambda*t) (lambda=p, t=n) Binomial (100,2%) = Poisson (0.02*100)

Ejemplo: La cantidad de clientes que llegan por unidad de tiempo para ser atendidos en una cola de servicio. Puntos de atención, operadores telefónicos de atención al cliente, etc.

Exponencial Aplicaciones: estimar la distribución del (tiempo) entre ocurrencias sucesivas de un evento que tiene una probabilidad de ocurrencia p constante por unidad de tiempo. A medida que p tiende a 0, un proceso Binomial se convierte en un proceso Poisson. Con bajos valores de p, se necesita un n elevado para observar el evento. Exponencial (beta) modela el “tiempo” hasta observar el evento por primera vez, Gamma (alfa,beta) el “tiempo” hasta observar alfa eventos. Entonces, cuando p es baja Geomet (p) se puede aproximar con Expon (1/p) Negbin (s,p) se puede aproximar con Gamma (s, 1/p)

Gamma Aplicaciones: estimar la distribución del tiempo entre ocurrencias sucesivas de un evento n veces cuando el evento tiene una probabilidad de ocurrencia p constante por unidad de tiempo. A medida que p tiende a 0, un proceso Binomial se convierte en un proceso Poisson. Con bajos valores de p, se necesita un n elevado para observar el evento. Exponencial (beta) modela el “tiempo” hasta observar el evento por primera vez, Gamma (alfa,beta) el “tiempo” hasta observar alfa eventos. Entonces, cuando p es baja Geomet (p) se puede aproximar con Expon (1/p) Negbin (s,p) se puede aproximar con Gamma (s, 1/p)

Ejemplos: Es muy utilizada en las teorías de la fiabilidad, mantenimiento y fenómenos de espera. A medida que p tiende a 0, un proceso Binomial se convierte en un proceso Poisson. Con bajos valores de p, se necesita un n elevado para observar el evento. Exponencial (beta) modela el “tiempo” hasta observar el evento por primera vez, Gamma (alfa,beta) el “tiempo” hasta observar alfa eventos. Entonces, cuando p es baja Geomet (p) se puede aproximar con Expon (1/p) Negbin (s,p) se puede aproximar con Gamma (s, 1/p)

Fundamentos de probabilidad para simulación. Variables Aleatorias Distribuciones de probabilidad Ley de los grandes números. Teorema del límite central.

Ley de los Grandes Números (desigualdad de Tchebycheff) Cuanto mayor sea el tamaño de la muestra, mayor será el ajuste entre la distribución muestral y la distribución teórica sobre la que se basa la muestra. la frecuencia relativa de los resultados de un cierto experimento aleatorio, tienden a estabilizarse en cierto número, que es precisamente la probabilidad , cuando el experimento se realiza muchas veces No importa cuántas iteraciones muestreemos, nunca sabremos el valor exacto de los parámetros de la población, pero cuantas más iteraciones corramos mayor va a ser la probabilidad que nuestros estimadores de los parámetros de la población estén dentro de un rango aceptable de los valores verdaderos.

Ejemplo intuitivo

Ejemplo simulado No importa cuántas iteraciones muestreemos, nunca sabremos el valor exacto de los parámetros de la población, pero cuantas más iteraciones corramos mayor va a ser la probabilidad que nuestros estimadores de los parámetros de la población estén dentro de un rango aceptable de los valores verdaderos.

Fundamentos de probabilidad para simulación. Variables Aleatorias Distribuciones de probabilidad Ley de los grandes números. Teorema central del límite.

Teorema Central del Límite (TCL) La media muestral de un conjunto de n variables muestreadas en forma independiente a partir de una misma distribución f(x) se ajusta a una distribución aprox. Normal con los siguientes parámetros: x = Normal ( mu, sigma / n1/2 ) En otras palabras, la distribución del promedio de un conjunto de variables aleatorias depende tanto de la cantidad de variables aleatorias promediadas como de la incertidumbre aportada por cada variable.

Teorema Central del Límite (cont.) La suma de n variables aleatorias independientes da como resultado una distribución aproximadamente Normal, sin importar la forma de la distribución de las variables sumadas. El producto de n variables aleatorias independientes da como resultado una distribución aproximadamente Lognormal, independientemente de la forma de la distribución de las variables intervinientes. Según el TCL, la suma de n variables aleatorias independientes con idénticas distribuciones de probabilidad se distribuye según una distribución Normal cuando n es suficientemente grande. Si las variables provienen de una distribución Normal (mu,sigma) entonces la suma dará: Normal (n*mu, ((n)1/2**sigma) El n necesario para lograr la convergencia a una normal dependerá en parte de la forma de la distribución de las variables intervinientes: Si son Normales, basta con n=1 Si son simétricas aunque no necesariamente normales, n > 10 Si son asimétricas, n > 20 o 30 Si son altamente sesgadas (sesgo > 2) , n > 50. La mayor parte de los modelos son combinaciones de sumas y productos de variables aleatorias que tienen diferentes distribuciones de probabilidad. Por lo tanto, no debiera sorprender que los resultados de los modelos den distribuciones que estén entre Normal y Lognormal. Muchas distribuciones paramétricas pueden ser conceptualizadas como la suma de otras distribuciones idénticas. En general, si la media es mucho mayor que el desvío de estas distribuciones, se pueden aproximar mediante una Normal.

Teorema Central del Límite (cont.) Según el TCL, la suma de n variables aleatorias independientes con idénticas distribuciones de probabilidad se distribuye según una distribución Normal cuando n es suficientemente grande. Si las variables provienen de una distribución Normal (mu,sigma) entonces la suma dará: Normal (n*mu, ((n)1/2**sigma) El n necesario para lograr la convergencia a una normal dependerá en parte de la forma de la distribución de las variables intervinientes: Si son Normales, basta con n=1 Si son simétricas aunque no necesariamente normales, n > 10 Si son asimétricas, n > 20 o 30 Si son altamente sesgadas (sesgo > 2) , n > 50. La mayor parte de los modelos son combinaciones de sumas y productos de variables aleatorias que tienen diferentes distribuciones de probabilidad. Por lo tanto, no debiera sorprender que los resultados de los modelos den distribuciones que estén entre Normal y Lognormal. Muchas distribuciones paramétricas pueden ser conceptualizadas como la suma de otras distribuciones idénticas. En general, si la media es mucho mayor que el desvío de estas distribuciones, se pueden aproximar mediante una Normal.

Simulación Monte Carlo 1. Diseñar el modelo matemático que representa el problema. 2. Especificar distribuciones de probabilidad para las variables aleatorias relevantes. 3. Incluir posibles dependencias entre variables. 4. Muestrear valores de las variables aleatorias. 5. Calcular el resultado del modelo según los valores del muestreo y registrar el resultado. 6. Repetir el proceso iterativamente hasta tener una muestra estadísticamente representativa. 7. Obtener la distribución de frecuencias del resultado de las iteraciones. 8. Calcular media, desvío y curva de percentiles acumulados. El análisis de escenarios tiene las siguientes limitaciones: Las combinaciones crecen exponencialmente cuantas más variables aleatorias haya en juego. Definir la aleatoreidad de cada variable como valores con probabilidades discretas ignora la posibilidad que las variables sean de tipo continuo. No tiene en cuenta que los valores más probables tienen una probabilidad de ocurrencia mucho mayor que los extremos. Montecarlo genera una serie de escenarios posibles, pero tiene en cuenta todos los valores que una variable puede tomar y pondera cada escenario por su probabilidad de ocurrencia.