PROGRAMACION DINAMICA

Slides:

Advertisements

Presentaciones similares

Tema 1: Programación dinámica

Advertisements

Son problemas secuenciales: El problema se puede dividir en etapas. Definición: Método que permite determinar de manera eficiente las decisiones que optimizan.

DESARROLLO DE LA POBLACIÓN BÁSICA. Una de las decisiones más importante que debe tomar un mejorador de plantas se refiere a la población básica a partir.

MÉTODO CONGRUENCIALES David Chacón. Método Congruenciales Se han desarrollado básicamente tres métodos de congruenciales para generar números pseudoaleatorios,

Introducción a la estadística. ¿Qué es la estadística? La Estadística es la parte de las Matemáticas que se encarga del estudio de una determinada característica.

LOS OBJETIVOS EN UNA INVESTIGACIÓN CIENTÍFICA DGilC.

Cuando el número de posibles resultados de un experimento es finito, su espacio muestral es finito y su cardinal es un número natural. Si el experimento.

FACULTAD: CIENCIAS ADMINISTRATICAS Y CONTABLES INTRODUCCION A LA ADMINISTRACION,FINANZAS Y NEGOCIOS GLOBALES GESTION DE FINANZAS EL PLAN FINANCIERO.

1 Problemas de decisión Tipo particular de problemas de optimización Sistemas que evolucionan con el tiempo Se toman decisiones en momentos sucesivos de.

Ingreso , proceso y salida de datos

U-6. Cap. III Introducción a la solución por series.

ESTADÍSTICAS INFERENCIALES

Decisiones de Inversión y Evaluación de Proyectos

Ciclos condicionales y exactos Estructura de control de ciclos

En INCERTIDUMBRE No se conocen las probabilidades de ocurrencia de los estados naturales, por lo tanto, hay que recurrir a criterios empíricos para tomar.

U.T. 11: Introducción A Las Bases De Datos

INVESTIGACIÓN DE OPERACIONES

VALOR ACTUAL NETO.

5. Análisis y diseño de sistemas secuenciales (I)

Unidad 5. Capítulo VI. Sistemas lineales no homogéneos.

Introducción a programación web Martin Esses

QUÉ ES LA ADMINISTRACION. ROLES DEL ADMINISTRADOR

Unidad 5. Capítulo II. Modelos de sistemas en forma matricial.

Básicos de Autómatas.

MUESTREO ALEATORIO CON REPOSICIÓN

Introducción a programación web Martin Esses

Ingeniería en Sistemas de Información

TUTORIAL PSeint.

Unidad 6. Capítulo I. Introducción.

MATEMÁTICA DISCRETA Y LÓGICA 1

Tipos de Datos abstractos

REGRESÍON LINEAL SIMPLE

PLAN DE MUESTREO.

Análisis de redes Por: Alexander Miss.

Tema 4 Introducción a la Programación Lineal

Taller Organización de Procedimientos Administrativos.

Kriging Consideremos información de determinada propiedad en el yacimiento y puntos en los cuales se tiene la estimación dea partir de los puntos.

Conjunto de procedimientos que permiten abordar un problema de investigación con el fin de lograr objetivos determinados. MÉTODO Descripción a detalle.

Tema 4 Introducción a la Programación Lineal

Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una.

Problema de Inversión integrantes: -Juan Victor Herencia Vicente -Jesus Angel Ccalli Ccalli.

UNIDAD N° I: INTRODUCCIÓN A LA PREVENCIÓN DE RIESGOS.

 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.

ALVAREZ OCHOA DEISY NAYELI

Desigualdades lineales Introducción a la Programación Lineal

PROGRAMACIÓN PLANEAMIENTO DE DESMONTAJE Y MONTAJE DE UN COMPRESOR.

MATEMATICAS APLICADAS A LAS CCSS-II DEPARTAMENTO DE MATEMÁTICAS

SISTEMAS DE ECUACIONES LINEALES.

Costos, Presupuestos y Programación de Obras Tema : Método PERT-CPM.

MÉTODO SIMPLEX. Ejemplo de Simplex: Vamos a resolver el siguiente problema: MaximizarZ = f(x 1,x 2 ) = 3x 1 + 2x 2 Sujeto a:2x 1 + x 2 ≤ 18 2x 1 + 3x.

Equipo 4 ÁRBOL DE DESICIÓN. UN ÁRBOL DE DECISIÓN:  Es una forma grafica y analítica para representar eventos o sucesos que puedan surgir a partir de.

LAS PROBABILIDADES.

CONTROLES Y ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN  1. Algoritmos: conjunto de instrucciones programadas para resolver una tarea específica.  2. Datos:

PLN hmm1 Modelos ocultos de Markov (HMM) Introducción Cálculo de la probabilidad de una observación Algoritmo Forward Algoritmo Backward Algoritmo de Viterbi.

DUALIDAD EN PROGRAMACION LINEAL Relaciones primal-dual Asociado a cada problema lineal existe otro problema de programación lineal denominado problema.

Tema 4 Introducción a la Programación Lineal. Cada muñeco: Produce un beneficio neto de 3 €. Requiere 2 horas de trabajo de acabado. Requiere 1 hora de.

Tamaño de la muestra. En una muestra probabilística cada individuo de la población a estudiar tiene una probabilidad conocida y no nula de ser seleccionado.

GESTIÓN DE PROYECTOS La gestión de proyectos está conformada por todas aquellas acciones que debes realizar para cumplir con una objetivo definido dentro.

MODELADO Y SIMULACIÓN Introducción al Modelado y Simulación.

Proceso de la investigación de mercado

Pipelining Peligros de control.

ESTADÍSTICA: CONCEPTOS GENERALES

Diseñas y elaboras algoritmos para la solución de problemas

Estrategia algorítmica

PIENSA EN GRANDE 1 Planeación, Control y Evaluación del Aprendizaje.

Tècnicas para proyectar los precios de los productos.

Inversiones, Proyectos y Control de Gestión Docente: José Luis Núñez Guerra Ingeniero Comercial Licenciado en Ciencias Económicas y Administrativas.

Transcripción de la presentación:

PROGRAMACION DINAMICA La programación dinámica consiste en una técnica que permite determinar de manera eficiente las decisiones que optimizan el comportamiento de un sistema que evoluciona a lo largo de una serie de etapas. En otras palabras, trata de encontrar la secuencia de decisiones que optimiza el comportamiento de un proceso polietápico. La estrategia a seguir consiste en comenzar con una introducción teórica que describe las características de los procesos que pueden ser representados por programación dinámica: los procesos polietápicos de decisión.

los diversos tipos de programación dinámica existentes: Programación dinámica no homogénea, frente a programación dinámica homogénea en el tiempo. Para este último caso, podremos plantearnos encontrar la solución para horizonte finito o para horizonte infinito.

Procresos polietápicos de decisión Las situaciones susceptibles de ser representadas mediante programación dinámica pueden describirse como procesos polietápicos de decisión. El problema puede dividirse en etapas. En cada una de esas etapas, debe tomarse una decisión. Tendremos la solución del problema cuando conozcamos la decisión óptima para cualquier situación que pueda presentarse en la evolución del sistema.

La programación dinámica va asociada a situaciones de evolución de un sistema que va evolucionando a lo largo de varias etapas (de ahí su carácter dinámico). En la mayoría de las ocasiones, se tratará de representar el comportamiento de un sistema que evoluciona a lo largo del tiempo. En otros casos, se trata de situaciones en las que las decisiones se toman de manera simultánea en el tiempo, pero en las que se evalúan las decisiones de manera secuencial. Al comenzar cada una de las etapas, antes de tomar la decisión, el sistema podrá encontrarse en un estado de los varios posibles para esa etapa.

Esto significa que para cada etapa debe definirse un conjunto de estados. El estado debe sintetizar toda la información que debemos conocer de la evolución del sistema en las etapas anteriores. Los estados posibles para una etapa no tienen por qué ser los mismos que para las etapas siguientes (aunque sí deben definirse de la misma manera: los estados aseguran la continuidad entre una y otra etapa) y el número de estados puede ser finito o infinito. Una vez tomada la decisión en el estado correspondiente, el sistema evolucionará hacia alguno de los estados posibles para la etapa siguiente.

Por lo tanto, el comportamiento del sistema puede percibirse como una secuencia de decisiones y evoluciones. Dicha evolución puede ser conocida con certeza, una vez tomada la decisión (tendremos una situación de programación dinámica determinista), o bien el sistema puede evolucionar hacia diferentes estados, según una ley de probabilidad conocida (siendo entonces programación dinámica aleatoria). El objetivo de la programación dinámica es de encontrar cuál es la política óptima para cada una de las etapas de la evolución del sistema. La política para una determinada etapa es la decisión óptima en cada uno de los posibles estados del sistema en dicha etapa.

Nótese que, para cada etapa, debe definirse una variable de decisión xn. Si el sistema tiene k estados en esa etapa, una política será un vector de k componentes, cuya componente e–sima es el valor de la variable de decisión para el estado e en la etapa n. La esencia de la estrategia de la programación dinámica se expresa mediante el principio de optimalidad: En un modelo de programación dinámica, la política óptima para las etapas que faltan hasta la finalización del proceso es independiente de las políticas adoptadas en las etapas anteriores.

Esta propiedad es la esencia de la programación dinámica y tiene dos implicaciones importantes: En primer lugar, la evolución futura del sistema a partir de una determinada etapa depende exclusivamente del estado en que nos encontremos en esa etapa. Nótese entonces que todo modelo de programación dinámica debe cumplir la propiedad markoviana: sólo necesitamos conocer la situación del sistema en el momento presente para determinar su evolución en las etapas siguientes.

En segundo lugar, un modelo de programación dinámica debe resolverse hacia atrás. Esto admite dos formulaciones, en esencia equivalentes: Si n son las etapas que ya ha realizado el sistema, conociendo la política óptima para la etapa n + 1, podremos encontrar la política óptima para la etapa n.

El procedimiento de solución se inicia al encontrar la política óptima para la última etapa.   Esta propiedad tiene que ver con la solución hacia atrás de la que se hablaba en la propiedad anterior. Es conveniente que la solución para la última etapa sea trivial, esto es, que pueda encontrarse sin problemas la decisión óptima para cada uno de los estados de la última etapa. Esto puede lograrse definiendo adecuadamente la función a optimizar. Es frecuente definir la función fN a optimizar en la etapa N como el valor de dicha función para las N últimas etapas.

Para encontrar la política óptima para las etapas anteriores, es necesario definir una relación recursiva para la función a optimizar.   Esto significa que, para la etapa n, la función a optimizar ha de poder expresarse en función de alguno de estos elementos: El estado en que nos encontremos en la etapa n–ésima. Los valores de la variable de decisión xn posibles para cada estado en. El óptimo de la función para la etapa n+1, para el estado (o estados) en+1 a que evolucione el sistema después de tomar la decisión xn

Para cada uno de los estados, deberemos determinar el valor óptimo de la función (que dependerá exclusivamente del estado del sistema), así como el valor x*n de la variable de decisión que optimiza el comportamiento del sistema para ese estado. Ese valor x*n formará parte de la política óptima para esa etapa.