Análisis de Procesos de Decisiones

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Intervalos de Confianza para la Media de la Población
Intervalos de Confianza para la Varianza de la Población
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Toma de decisiones bajo condiciones de riesgo
PRUEBA DE HIPOTESIS Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores.
Fabrizio Marcillo Morla MBA
Contraste de Hipótesis
Estadística Teórica II
} LISSET BÁRCENAS MONTERROZA
Comprobación de diferencias entre medias
Selección del modelo adecuado
TEORÍA DE LA DECISIÓN BAJO INCERTIDUMBRE
PRUEBAS DE HIPÓTESIS Mercedes de la Oliva.
La prueba U DE MANN-WHITNEY
KRIGING.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
INFERENCIA ESTADISTICA
PRUEBAS DE HIPOTESIS HIPOTESIS
Estimación por intervalos de confianza.
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
Conceptos básicos de inferencia
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
ECONOMÍA DE LA INFORMACIÓN
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Sesión 2: Métodos Probabilísticos Básicos
Clases 3 Pruebas de Hipótesis
Inferencia Estadística
Unidad VI: PRUEBAS DE HIPOTESIS
Clases 4 Pruebas de Hipótesis
Diseño Estadístico y Herramientas para la Calidad
Unidad V: Estimación de
ANALISIS DE DATOS CATEGORICOS
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Inferencias con datos categóricos
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
TEMA 15 * CONTRASTES DE HIPÓTESIS
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTIMACION POR INTERVALOS
Inferencia Estadística
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Estimación Diferencia de dos medias
ESTIMACIÓN DE PARÁMETROS
RIESGO, RENDIMIENTO Y VALOR
ECONOMÍA DE LA INFORMACIÓN TEOREMA DE BAYES Teoría de la decisión – Facultad de Ciencias Económicas - UBA.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
NORMA INTERNACIONAL DE AUDITORÍA 530
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Pruebas paramétricas y no paramétricas
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
CAPACITACIÓN, INVESTIGACIÓN, ESTADÍSTICA Y MERCADEO
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Tarea # 4 PRUEBAS DE HIPÓTESIS ESTADÍSTICAS. PRUEBA DE HIPÓTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba,
METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP
PRUEBA DE SIGNIFICANCIA
Transcripción de la presentación:

Análisis de Procesos de Decisiones Dr. Viterbo H. Berberena G.

Tema I Modelos de Decisión 4 Sesiones (12 horas clases)

1.1 Conceptos Básicos. 1.2 Modelos Clásicos. Decisiones, estados de la naturaleza y probabilidades. Resultados o pagos. Árboles de decisión. 1.2 Modelos Clásicos. Modelo del pesimista (maxmin). Modelo del optimista (maxmax). Modelo de minimización de las pérdidas de oportunidad. Modelo del pago promedio.

1.4 Modelos de Minería de Datos. Modelo del valor monetario esperado. Valor de la información perfecta. 1.3 Análisis Bayesiano. Valor de la información imperfecta. 1.4 Modelos de Minería de Datos. Modelo de lealtad. Modelo de rentabilidad. Modelo de análisis de respuesta. Modelo de asociación.

Introducción al Análisis Bayesiano En los casos en que debe repetirse varias veces una decisión bajo condiciones similares y existe experiencia anterior que puede utilizarse para tomar estas decisiones, la situación se conoce como Toma de Decisiones Utilizando Datos Previos. En el caso de la pizzería Ashley, el problema de determinar cuántas pizzas hornear es un ejemplo de este tipo de decisiones.

Demanda de Pizzas en los últimos 100 días En las ocasiones en las que las condiciones pueden diferir (por ejemplo, después de un juego de fútbol o durante una tormenta de nieve) no sería apropiado utilizar el enfoque anterior, basado sólo en la experiencia previa con la demanda diaria. Demanda de Pizzas en los últimos 100 días Número de pizzas que se solicitan 150 160 170 180 Número de días 20 40 25 15

Cuando existe datos previos disponibles como soporte para toma de decisiones, es posible utilizar dos tipos de análisis: El Análisis Clásico. El Análisis Bayesiano. El análisis clásico está formado por la pruebas de hipótesis que a su vez es una parte de lo que se conoce como inferencia estadística (Estimación de parámetros poblacionales y pruebas de hipótesis).

En este caso se muestrea la población que está bajo investigación con el objetivo de buscar una evidencia estadística que nos permita rechazar o no cierta hipótesis formulada de antemano. Este es el tipo de análisis que por lo general se enseña en los cursos introductorios de estadística, bajo el nombre de Pruebas de Hipótesis.

Las pruebas de hipótesis pueden ser: Paramétricas. No Paramétricas. Paramétricas: El modelo especifica ciertas condiciones que se supone que se cumplen y que ordinariamente no se prueban (supuestos de la prueba). Requiere de una escala de medición cuantitativa.

No Paramétricas: El modelo no especifica condiciones de los parámetros de la población donde se toma la muestra. No requiere de una escala de medición cuantitativa. Por ejemplo, en el caso de la pizzería Ashely puede determinar la demanda esperada por medio del siguiente cálculo:

Con base en la demanda esperada, Ashley podría esperar que la demanda excediera, en promedio, las 160 pizzas por noche. Para probar esa expectativa se puede utilizar el análisis clásico. Para ilustrar como funciona el análisis clásico (prueba de hipótesis), a continuación se probara, sí la demanda de pizzas es, por lo general (en promedio), diferente de 160 pizzas.

Procedimiento de la Prueba de Hipótesis: Para éste caso específico, la Prueba t (prueba paramétrica de comparación de la media con un valor) es la más adecuada. Procedimiento de la Prueba de Hipótesis: 1. Formulación de la hipótesis nula y las alternativas.

2. Elección de Modelo Estadístico. Naturaleza de la población - La variable aleatoria X se distribuye normalmente con media  y varianza 2. Método de muestreo – Aleatorio. Requisito de medida – Escala de Intervalos. Las pruebas más poderosas son apoyadas en suposiciones fuertes y amplias. Por ejemplo la prueba t y F.

 = 0.05 significativo.  = 0.01 muy significativo. 3. Nivel de significación (a) y tamaño de muestra (n).  = 0.05 significativo.  = 0.01 muy significativo. Errores: P (rechazar Ho siendo verdadera) =  P (no rechazar Ho siendo falsa) = 

4. Distribución muestral. De forma ideal  y  se especifican y queda determinada n. En la práctica se escogen  y n y queda definido . 4. Distribución muestral. Es una distribución teórica, conforma a Ho, de algún estadígrafo, para hacer aseveraciones de probabilidad acerca de la ocurrencia de ciertos valores numéricos del mismo.

Se supone que la distribución muestral de: Es una distribución t-student con n-1 grados de libertad.

5. Región de rechazo. Es una zona de la distribución muestral que se compone de un subconjunto de valores, de manera que la probabilidad de ocurrencia de estos es igual o menor que .

5. Decisión. Esta consiste en rechazar o no la hipótesis nula en base a la evidencia estadística. Si se rechaza H0, entonces se acepta H1.

X f(x) a X f(x) a X f(x) a 2 Valor crítico del estadígrafo Valores críticos del estadígrafo a 2

Resultados de la Prueba t en SPSS

Criterios para elegir una prueba estadística: a) La potencia de la prueba. b) La aplicabilidad del modelo estadístico en que se basan los datos de la investigación. c) La potencia eficiencia. d) El nivel de medida logrado en la investigación.

Análisis Bayesiano En este análisis se combinan los datos previos (o probabilidades subjetivas) con datos muestrales o de prueba, utilizando la fórmula desarrollada por el ministro inglés Thomas Bayes. Procedimiento para el análisis bayesiano: Se elabora una matriz de decisión que contiene las consecuencias monetarias de las diversas acciones (tabla de utilidades).

Se realiza un análisis previo utilizando los datos disponibles (VME). Se realiza un segundo análisis, preposterior, en el cual se determina si resulta útil llevar a cabo pruebas o muestras adicionales (VII). Si el análisis anterior muestra que es económicamente útil experimentar para obtener mayor información, esta se utilizará para modificar las probabilidades previas y determinar las probabilidades posteriores.

El análisis Bayesiano presenta ventajas con respecto al análisis clásico, ya que en este sólo se realizan pruebas adicionales si un análisis preposterior de los datos muestra que estas serían económicamente valiosas. En el análisis clásico siempre se procede a realizar una prueba o recolectar una muestra.

Valor de la Información Perfecta ¿Cuánto estaría dispuesto a pagar el TD para obtener información adicional sobre cuáles serán las circunstancias reales? Si sabemos con exactitud cuál estado de la naturaleza ocurrirá, es fácil determinar la alternativa que debe elegirse, es decir la que produce mayor pago para ese estado de la naturaleza.

En el problema de la pizzería Ashley, para un número determinado de demanda de pizzas, el elegiríamos hornear con anticipación el número de pizzas que maximizara las utilidades netas. Por ejemplo, para la situación en la que supiéramos con certeza que habría una demanda de 160 pizzas, las utilidades máximas ocurrirían si se hornearan 160 pizzas, y esa utilidad sería $320. Si calculáramos esto para cada uno de los estados de la naturaleza se generaría la tabla siguiente.

TABLA DE PAGOS MÁXIMOS

Puesto que cada estado de la naturaleza ocurre solo durante una fracción del tiempo, es posible calcular el valor VME para el caso de la información perfecta utilizando los pagos máximos y las probabilidades para cada estado de la naturaleza.

Para calcular el valor de la información perfecta (VIP), se calcula la diferencia entre el valor monetario esperado para la información perfecta y el valor monetario esperado máximo sin información perfecta.

En el caso de la pizzería, el TD estaría dispuesto a pagar hasta $11 diarios para conocer con anticipación exactamente cuántas pizzas se requerirán cada día. Si la información no es perfecta, o el costo de la información adicional es mayor de $11, sería mejor prescindir de esta.

Valor de la Información Imperfecta En la sección anterior se presentó la información perfecta. Sin embargo, por lo general la información proviene de algún procedimiento de prueba, por lo que esta no siempre pronostica en forma correcta el estado de la naturaleza que ocurrirá.

Por ejemplo, un meteorólogo podría, con base en alguna prueba, pronosticar lluvia y, aún así, este estado de la naturaleza podría ocurrir sólo en 70% de las veces que se hace esta predicción. Debido a esta imperfección en el poder predictivo, el cálculo de la información de prueba (imperfecta) es algo más complejo que para la información perfecta.

Para comprender el procedimiento que se utiliza para el cálculo de información imperfecta se procede de la forma siguiente: Se define como la probabilidad de que ocurra en realidad el evento N, dado que el resultado de la prueba fue R. Se lee como la probabilidad de N, dado R.

Porque las pruebas siempre son imperfectas: Ejemplo: Si un meteorólogo está correcto en el 70% de las veces. donde, N - llueve, y R - se pronostica lluvia.

Por lo general se desconocen los valores de , puesto que estos valores sólo se conocen después de haber utilizado la prueba las suficientes veces para recopilar datos que permitan calcular probabilidades. Por lo general se conoce lo opuesto -la probabilidad de que ocurra un pronóstico acertado una vez que llueve. Esto último se puede calcular utilizando datos históricos.

Para determinar , se utiliza el Teorema de Bayes: Por lo general, los valores del numerador pueden obtenerse a partir de datos de prueba y el denominador se determina a partir de los dos anteriores.

Se calcula a partir de datos previos la probabilidad de que la prueba sea exacta (probabilidad condicional). Es la probabilidad de ocurra un resultado particular, también puede ser una probabilidad basada en la experiencia (a priori).

La probabilidad se calcula utilizando el resultado de la teoría probabilística: Donde incluye todos los eventos que no sean , es decir, es la negación de .

El Teorema de Bayes será: Este resultado se conoce como probabilidades a posteriori y se pueden utilizar para llevar a cabo el análisis preposterior con el objetivo de determinar si se tiene que llevar a cabo una prueba o muestreo.

APLICACIÓN AL CASO DE LA PIZZERÍA El TD necesita conocer la cantidad diaria de pizzas a hornear con anticipación, que proporcione las mayores utilidades. Hay un servicio de pronóstico con un costo de $5/día. ¿Se debe contratar este servicio de pronóstico?

Si los pronósticos tuvieran una exactitud de un 100%, su valor sería $11. Como los pronósticos no tienen la exactitud del 100%, entonces valen menos. A partir de datos de ventas diarias anteriores se calcula la siguiente tabla de probabilidades de prueba. Las entradas de la tabla siguientes son probabilidades condicionales .

Tabla de Probabilidades de Prueba

Las entradas de la tabla anterior son las probabilidades de que se haya pronosticado cada número de pizzas, dado el número que en realidad se solicitó (demanda real): Por ejemplo, en los días en que se solicitaron 160 pizzas (demanda real), el pronostico fue de 150 pizzas ¼ de las veces, de 160 ½ de las veces, de 170, también ¼ de las veces, y por último de 180, 0 veces.

Con el objeto de convertir las probabilidades Con el objeto de convertir las probabilidades en se calcula para cada número de pizzas pronosticado, utilizando la siguiente ecuación: Ejemplo: En la tabla anterior, para R = 150 (pronóstico de la demanda) N = 150 (demanda real). = 160, 170, 180.

Para calcular y se utilizan los valores del muestreo de solicitudes de pizzas de 100 días (probabilidades a priori):

El cálculo de será:

En la expresión anterior las cantidades entre paréntesis son la primera fila de la tabla de probabilidades de prueba y los valores entre corchetes son las probabilidades calculadas con los datos previos (probabilidades a priori). El resto se calcula de forma similar:

Puede observarse que si se suman las probabilidades de pronosticar cada número de pizzas se obtiene la unidad. Esto es de esperarse, puesto que debe pronosticarse algún número de pizzas, 150, 160, 170 o 180.

Utilizando cada uno de los elementos de cada una de las sumas anteriores para el cálculo de se obtiene una nueva tabla donde cada entrada es:

Tabla Modificada de Probabilidades Conjuntas

Si se realiza el cálculo para cada uno de los valores de la tabla anterior se obtiene una nueva tabla.

Tabla de probabilidades a posteriori

Las entradas de la tabla anterior son las probabilidades: Cada fila de la tabla anterior es ahora una distribución completa de probabilidad a posteriori y puede utilizarse para pronosticar los niveles de demanda a través de un análisis preposterior.

Ahora estamos en condiciones de calcular el valor monetario esperado de la contratación de un sistema de pronóstico a través de un análisis preposterior. Para esto utilizamos las filas de la tabla de probabilidades a posteriori combinandola con la tabla de utilidades de la pizzería.

Tabla de VME con un pronóstico de 150

Tabla de VME con un pronóstico de 160

Tabla de VME con un pronóstico de 170

Tabla de VME con un pronóstico de 180

Utilizando la alternativa preferible para cada uno de los resultados posibles de la prueba y la probabilidad de que ocurra cada uno de estos resultados ( a partir de la tabla de probabilidades a posteriori), es posible calcular el VME utilizando la prueba (tabla de utilidades de prueba).

El VME que resulta de utilizar un sistema de pronóstico es $320 y el VME sin usar ningún sistema era de $316. Por tanto el valor neto de utilizar un sistema de pronóstico es de $4/día (Valor de la Información Imperfecta).

¿Se debe contratar un servicio de pronóstico? Explique su respuesta. El VME que resulta de utilizar un servicio de pronóstico aporta un valor neto de $4/día (Valor de la Información Imperfecta). Puesto que este valor es inferior al costo de contratar un sistema de pronóstico ($5/día) al TD de la pizzería le convendría más no utilizar el sistema de pronóstico externo.

Resumen del Procedimiento del Análisis de Bayes Paso 1. Elaborar una tabla de probabilidades de prueba, es decir, P(el resultado de la prueba será R/ el resultado real fue N) y un conjunto de probabilidades previas P(N), para cada estado de la naturaleza.

Paso 2. Para cada renglón de la tabla de probabilidades de prueba, multiplicar cada elemento por la probabilidad previa correspondiente de estado de la naturaleza, P(N). Cada producto es elemento de una tabla modificada de probabilidades, P(R/N)*P(N). La suma de estas probabilidades para cada renglón es ahora P(R).

Paso 3. Dividir cada elemento de la matriz de probabilidades modificada entre la suma de su renglón, es decir, P(R/N)*P(N)/P(R), para obtener los elementos de la tabla de pronósticos, P(N/R).

Paso 4. Utilizando la matriz de pago calcular por separado el VME máximo para cada resultado de prueba, utilizando las probabilidades del renglón de la matriz de predicción que corresponde a ese resultado de prueba.

Paso 5. Utilizando los VME máximos para cada resultado de prueba, calcular el VME (de la prueba) multiplicando el VME máximo para cada resultado de prueba por la probabilidad de que ocurra este resultado, P(R), y sumando todos estos resultados.

Paso 6. Calcular el valor de la prueba determinando la diferencia entre el VME de la prueba calculado en el paso 5, y el VME máximo posible sin la prueba (Valor de la información imperfecta).

Tarea Extraclase por Equipos Un equipo de Liga Pequeña de Béisbol ha estado empleando una máquina automática de pitcheo. Si la máquina se instala bien (es decir, si está ajustada correctamente), lanzará “strikes” 85% de las veces. Si no está bien instalada, lanzará “strikes” sólo 35% de las veces. La experiencia nos indica que las instalaciones se efectuan correctamente 75% de las veces. Una vez que se instala la máquina para la práctica de bateo en un día, lanza 3 “strikes” en los primeros tres lanzamientos. ¿Cuál será la probabilidad posterior de que la instalación esté bien hecha?