Docente: MSC. Javier Gil Antelo Análisis de riesgo Docente: MSC. Javier Gil Antelo
Determinísticos Tipos de modelos Probabilísticos
Modelo determinístico Es un modelo matemático donde unos datos ingresados, producen un resultado. Probabilísticos
Determinísticos Tipos de modelos Probabilísticos
Modelo estocástico o probabilístico Determinísticos Son modelos que contemplan la incertidumbre debido a que por lo menos el valor de una variable es tomado al azar en función a distribuciones de probabilidad, sirven por lo general para realizar grandes series de muestreo. Tipos de modelos ¿Cuál es la probabilidad de que las ventas sean mayores a $us. 70.000 si las unidades vendidas pueden variar entre 800 a 1.200 unidades?
Modelos Cuando una variable aleatoria es dependiente de otras variables aleatorias, esta relación esta descrita por un modelo probabilístico. De manera que la incertidumbre de las variables aleatorias independientes en un modelo transmiten la incertidumbre a la variable dependiente o pronosticada por el modelo.
Simulación de Monte Carlo Determinísticos La simulación de Monte Carlo es una técnica que combina conceptos estadísticos (muestreo aleatorio) con la capacidad que tienen los ordenadores para generar números pseudo-aleatorios y automatizar cálculos. Tipos de modelos
Simulación de Monte Carlo Determinísticos Los orígenes de esta técnica están ligados al trabajo desarrollado por Stan Ulam y John Von Neumann a finales de los 40 en el laboratorio de Los Alamos (EEUU), cuando investigaban el movimiento aleatorio de los neutrones para el desarrollo de la bomba atómica. En la década de los 70, esta técnica se hace más popular y comienza a ser utilizado en diversas áreas como ser informática y economía. Stan Ulam Tipos de modelos John Von Neumann
Determinísticos Tipos de modelos La simulación de Monte Carlo está presente en todos aquellos ámbitos en los que el comportamiento aleatorio o probabilístico desempeña un papel fundamental; precisamente, el nombre de Monte Carlo proviene de la famosa ciudad de Mónaco, donde abundan los casinos de juego y donde el azar, la probabilidad y el comportamiento aleatorio conforman todo un estilo de vida. Determinísticos Tipos de modelos Ciudad y Casinos de Monte Carlo
Determinísticos Tipos de modelos En el mercado existen de hecho varios complementos de Excel (Add-Ins) específicamente diseñados para realizar simulación Monte Carlo, siendo los más conocidos: Determinísticos Tipos de modelos
Conceptos Estadísticos Básicos DIVISIÓN GENERAL DE LA ESTADÍSTICA Determinísticos DIVISIÓN GENERAL DE LA ESTADÍSTICA Descriptiva Inferencial
Cuantitativas Tipos de variables Cualitativas
Variables cuantitativas Variables discretas Son aquellas que se cuentan, pueden tomar valor enteros positivos. Ejemplos: cantidad de estudiantes inscritos en la materia, cantidad de sillas en el curso, cantidad de focos que tiene el aula, etc. Tipos de modelos
Variables cuantitativas Variables continuas Son aquellas que dentro de un intervalo de clase o rango pueden tomar valores infinitos, es decir se pueden medir y los valores pueden estar expresados en fracciones. Ejemplos: peso de una persona, estatura de un alumno, ventas de una empresa, etc. Tipos de modelos
Distribuciones de frecuencia Determinísticos Agrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría. Ejemplo: AUTOVENTA "SANTA CRUZ" Precio de venta de vehículos (Ex. en $us) Cantidad de vehículos desde 5.000 hasta 10.000 13 desde 10.000 hasta 15.000 21 desde 20.000 hasta 25.000 35 desde 25.000 hasta 30.000 39 desde 30.000 hasta 35.000 12 desde 35.000 y más 5 TOTAL 125
Representaciones gráficas Histograma Determinísticos Las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias están representadas por las alturas de las barras. Tipos de modelos Ejemplo:
Representaciones gráficas Polígono de frecuencia Determinísticos Similar al histograma, consiste en unir con una línea los puntos medios de los techos de los rectángulos del histograma. Ejemplo:
Medidas de tendencia central Determinísticos Media aritmética También denominada como «promedio», es la suma de todos los valores, dividido entre el número total de los mismos. Su principal desventaja es de que está muy afectada por los valores extremos (muy grandes o muy pequeños).
Medidas de tendencia central Mediana Determinísticos Es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. 50% de las observaciones son mayores que la mediana y 50% son menores que ella. < = Mediana =>
Medidas de tendencia central Moda Determinísticos Es el valor de la observación que aparece con más frecuencia. ¿Cuál es el valor modal de los precios? NO hay valor modal
Medidas de tendencia central Posiciones relativas de la media, mediana y moda. Determinísticos Media Mediana Moda Distribución simétrica (sesgo cero)
Medidas de tendencia central Posiciones relativas de la media, mediana y moda. Determinísticos Asimétrica a la derecha (sesgo positivo) Moda Mediana Media Ej: Salarios Mensuales Asimétrica a la izquierda (sesgo negativo) Media Mediana Moda Ej: Notas de un examen
Medidas de dispersión ó variación ¿Por qué estudiar la dispersión? Porque cuando la dispersión es amplia, la medida de tendencia central no es representativa. 1) Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o más promedios. 2) Ejemplo: Ud. puede invertir en 2 portafolios de acciones, el 1ero tiene una rentabilidad promedio de $us. 10.000 anuales y el 2do de $us. 11.000 anuales. Suponiendo que el monto de la inversión a realizar es el mismo ¿Qué decisión tomaría? Pero ¿Qué decisión tomaría si el 1er portafolio tiene una desviación estándar histórica de $us. 50, mientras que la desviación del 2do portafolio es de $us. 4.000 ?
Medidas de dispersión ó variación Varianza La media aritmética de las desviaciones cuadráticas con respecto a la media. Desviación Estándar La raíz cuadrática positiva de la varianza. NOTA: La variancia es difícil de interpretar porque las unidades están al cuadrado, mientras que la desviación estándar se presenta en las mismas unidades que los datos.
Medidas de dispersión ó variación Datos con baja dispersión Datos con alta dispersión Media Media
Medidas de dispersión ó variación Regla Empírica Aplicable solamente a distribuciones simétricas del tipo de campana. 68% = 1 . 95% = 2. 99,7% = 3.
Medidas de dispersión ó variación Coeficiente de variabilidad Es la ración (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje. NOTA: Al multiplicar por 100, se convierte la expresión decimal a porcentaje.
Medidas de dispersión ó variación Cuartiles Si los datos son ordenados de menor a mayor, o de mayor a menor, los cuartiles dividen las observaciones en cuatro partes iguales, por lo tanto existen 3 cuartiles. Q 1 Q 3 Q 2 = Mediana 25%
Medidas de dispersión ó variación Deciles (Percentiles) Si los datos son ordenados de menor a mayor, o de mayor a menor, los deciles dividen las observaciones en diez partes iguales, por lo tanto existen 9 deciles. D1 D7 10% D2 D3 D4 D6 D8 D9 D5 Mediana
Medidas de dispersión ó variación Centiles Si los datos son ordenados de menor a mayor, o de mayor a menor, los centiles dividen las observaciones en cien partes iguales, por lo tanto existen 99 centiles.
Medidas de forma Coeficiente de asimetría (De Pearson) La asimetría es útil porque indica si la mayor cantidad de datos se encuentran por encima o debajo de la media.
Medidas de forma Coeficiente de asimetría (De Pearson) Cuando el coeficiente es igual a cero, la distribución es simétrica.
Medidas de forma Coeficiente de asimetría (De Pearson) Cuando el coeficiente es mayor que cero, la distribución es positivamente asimétrica. Nota: El coeficiente puede variar entre 0 y 3, a medida que más se acerca a 3, la asimetría es mayor.
Medidas de forma Coeficiente de asimetría (De Pearson) Cuando el coeficiente es menor que cero, la distribución es negativamente asimétrica. Nota: El coeficiente puede variar entre 0 y -3, a medida que más se acerca a -3, la asimetría es mayor.
Medidas de forma Kurtosis o apuntamiento Mide el grado de deformación vertical, es decir, en que medida una curva de frecuencia está deformada hacia arriba o hacia abajo en relación a una curva normal.
Medidas de forma Curtosis Cuando el coeficiente de curtosis es igual a tres, la distribución es mesocurtica o normal. Curtosis = 3
Medidas de forma Curtosis Cuando el coeficiente de curtosis es mayor a tres, la distribución es leptocurtica y es más apuntada de la distribución normal. Curtosis > 3
Medidas de forma Curtosis Cuando el coeficiente de curtosis es menor a tres, la distribución es platicurtica y es menos apuntada de la distribución normal. Curtosis < 3
Análisis de correlación Es el conjunto de técnicas estadísticas empleado para medir la intensidad de la asociación entre dos variables. Coeficiente de correlación de Spearman p = coeficiente de correlación de Spearman D2 = Cuadrado de las diferencias entre X e Y N = número de parejas
Análisis de correlación Ejemplos de grado de correlación: Correlación negativa (inversa) y débil (X y Y tienen cierta relación lineal) . Y X Precio Cantidad vendida Correlación = 0 (X y Y no tienen relación lineal) Y X . Número de hijos Salario Correlación positiva (directa) y fuerte (X y Y tienen una relación lineal intensa) . Y X Notas escuela Notas universidad
Análisis de correlación El siguiente cuadro resume la intensidad y la dirección del coeficiente de correlación: 1 Correlación negativa perfecta -1 -0,5 0,5 Sin positiva (inversamente proporcional) (directamente proporcional) moderada débil intensa
Conceptos Estadísticos Básicos DIVISIÓN GENERAL DE LA ESTADÍSTICA Determinísticos DIVISIÓN GENERAL DE LA ESTADÍSTICA Descriptiva Inferencial
¿Qué es probabilidad? Valor que describe la posibilidad relativa de que ocurra un evento.
Distribuciones de probabilidad Una distribución de probabilidad muestra todos los resultados posibles de un experimento y la probabilidad de ocurrencia de cada resultado.
Distribuciones de probabilidad de Crystal Ball Seleccionar una distribución para un supuesto es uno de los pasos más desafiantes para realizar la simulación con Crystal Ball.
¿Cómo seleccionamos las distribuciones adecuadas? Sin datos históricos Teoría Opinión de expertos
¿Cómo seleccionamos las distribuciones adecuadas? Con datos históricos Pruebas de bondad de ajuste (Herramienta de CB denominada Ajuste Grupal)
Pruebas de bondad de ajuste El objetivo principal es determinar si una distribución histórica concuerda o «se ajusta» con alguna distribución que se asevera.
Pruebas de bondad de ajuste VARIABLES DISCRETAS Pruebas de Chi Cuadrado
Pruebas de bondad de ajuste VARIABLES CONTINUAS Anderson Darlin (Si la simetría= 0) Kolmogorov Smirnov
Distribuciones más utilizadas
Distribuciones más utilizadas
Distribuciones más utilizadas
Distribuciones más utilizadas
¿Qué distribuciones se pueden usar? Usar Distribuciones basándose en datos históricos o en principios físicos (Normal, Lognormal). Usar la Opinión de Expertos junto con la Distribución Triangular: Mínimo Máximo Más Probable Usar límites con la Distribución Uniforme: Límite inferior Límite superior More Realistic, Less Conservative MEAN M/L MIN MAX Less Realistic, More Conservative LOWER BOUND UPPER BOUND
DISTRIBUCIÓN UNIFORME Todos los valores dentro del rango factible tienen la misma densidad de probabilidad. Parámetros : Uniform (min,max) Aplicaciones: Se usa en la generación de los valores de todas las demás distribuciones de probabilidad en el muestreo aleatorio. Es una aproximación muy cruda para usar como estimación de la incertidumbre percibida de un parámetro
EJEMPLO UNIFORME Una compañía de inversiones esta interesada en comprar un centro comercial de gran magnitud. Esta compañía piensa gastar al menos $ 500.000 pero no más de $ 900.000. El gerente piensa que cualquier monto que este dentro de este rango, tiene igual probabilidad de ocurrencia. Graficar la distribución de probabilidad para esta variable.
GRÁFICO UNIFORME
DISTRIBUCIÓN TRIANGULAR Aplicaciones: estimar subjetivamente la distribución de la variable aleatoria cuando todo lo que puede precisarse de la misma es el valor mínimo, el valor más probable y el valor máximo. Parámetros: Triang (min, +prob, max). Variando la posición más probable con relación a los extremos, la distribución puede ser simétrica o no.
EJEMPLO TRIANGULAR El propietario de una estación de gasolina que vendió por semana para abastecer su estación. Sus ventas pasadas indican que vendió un mínimo de 3.000 litros y un máximo de 7.000 litros por semana, pero en la mayoría de las semanas las ventas fueron de 5.000 litros. Graficar la distribución de probabilidad para esta variable.
GRÁFICO TRIANGULAR
DISTRIBUCION NORMAL Se caracteriza por su forma acampanada. Es simétrica y tiene la propiedad de que la mediana, la moda, la media aritmética coinciden. Aplicaciones: una variedad de situaciones, como se desprende del Teorema Central del Límite. Es útil en finanzas pues la suma o diferencia de distribuciones Normales resulta también en una distribución Normal con parámetros que pueden ser determinados a partir del TCL.
EJEMPLO NORMAL Un gerente de recursos humanos estima que la distribución de los salarios de todos los empleados están distribuidos normalmente con una media de $ 800 y una desviación estándar de 30 $. Graficar la distribución de probabilidad para esta variable.
GRÁFICO NORMAL
DISTRIBUCIONES TRUNCADAS Un vendedor de casas sabe que los precios de venta de los inmobiliarios tienen una distribución normal con media igual a $ 100.000 y desviación estándar de $ 15.000. Sin embargo, no existe posibilidad de vender una casa en menos de $ 80.000. Graficar la distribución de probabilidad para esta variable.
GRÁFICO DISTRIBUCIÓN TRUNCADA
DISTRIBUCIÓN PERSONALIZADA (CUSTOM) Es posible una distribución “personalizada” para representar una situación única que no puede ser modelada por ninguna de las distribuciones de probabilidad conocidas. Ejemplos: describir valores simples, rangos discretos, continuos.
EJEMPLO DISTRIBUCIÓN PERSONALIZADA (CUSTOM) Una empresa desea describir el costo probable de producir un nuevo producto. La compañía decide que el costo podría ser $5, $8 o $ 10.
Elección de una distribución que se ajuste a las entradas del modelo Cuando existe información empírica: Para muchos inputs de un modelo de simulación podría existir información empírica disponible, a través de registros históricos o recopiladas especialmente al efecto. Este enfoque tiene sus desventajas: Por un lado, la información histórica podría no representar adecuadamente la verdadera población debido a un error de muestreo. Adicionalmente el uso de información empírica impide el uso de valores fuera del rango original.
Elección de una distribución que se ajuste a las entradas del modelo Cuando no existe información disponible: En el caso de que no exista información disponible, todo queda librado a juicio de quien construye el modelo en cuanto a seleccionar la distribución adecuada a utilizar para modelar el comportamiento de cierta variable aleatoria que sirva de input al modelo. Es por eso que un conocimiento de las distintas alternativas de distribuciones que se pueden utilizar, resulta valioso.
Como Modelar hojas de cálculo
Qué diferencia hay entre estos dos modelos?
Consejo 1: Use colores y espacios para dividir y resaltar
Consejo 2: Etiquete sus variables de entrada….
Consejo 3: pero entradas separadas son mejores aún
Consejo 4: Diseño: ¿Cómo cambiarlo?
Consejo 4: ¿Es mejor este diseño? ¿Por qué?
Consejo 4: ¿Qué tal este diseño?
Consejo 5: Qué es bueno y que no lo es
Consejo 6: Expresar la arquitectura del modelo
Consejo 7: Esconda información basura
Consejo 8: Exponga sus variables de entrada: Normal o Lognormal?
Consejo 9: Haga una simulación real, no fácil
Consejo 10: Esto es más real
¿Cuál es el error más frecuente en los modelos determinísticos?
Vamos a simular el siguiente modelo:
Si graficamos un diagrama de dispersión, sería algo como:
Es esto real para su negocio?
Este es el caso más frecuente: Ingresos y Costos están correlacionados
With Correlations No Correlations Consejo 11: No correlacionar estas variables, sobreestima el riesgo en más de un 50%!!!!!! With Correlations No Correlations
Consejo 12: Asegúrese de guardar todo… sino recuerde la Ley de Murphy
Consejo 13: Preste atención con los nombres!!!!
Muchas gracias por su atención