Informe Innovacion

Cargado por

Niver Torres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

21 vistas5 páginas

Informe Innovacion

Cargado por

Niver Torres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

PROCESO DE DECISIÓN MARKOVIANO

NIVER OSWALDO TORRES BARRIGA

INGENIERIA INDUSTRIAL
FACULTAD DE INGENIERIA
UNIVERSIDAD ECCI
BOGOTÁ D.C.
2022

1
INTRODUCCION

Los procesos de decisión o control markovianos modelan sistemas dinámicos

estocásticos controlados, es decir, sistemas cuya evolución está sujeta a factores
aleatorios y que puede modificarse por medio de la selección de ciertas variables
de decisión o de control. Este tipo de modelos surgen en un sin número de áreas
de la ciencia y la ingeniería como f finanzas economía], robótica, programas de
salud redes de comunicación, aprovechamiento de recursos naturales; acuíferos;
petroleros, sistemas de transporte, sistemas de producción e inventario,
programas de mantenimiento y remplazo de equipo, etc.

Procesos de Decisión de Markov

• Tratamos ahora secuencias de acciones cuyos efectos son inciertos.
• Similares a espacios de estados, pero el efecto de una acción está descrito
mediante una distribución de probabilidad
• Además, se introduce la noción de “recompensa” en un estado. • Pueden verse
como “problemas de decisión secuenciales”
• ¿Cómo decidir la mejor acción en cada momento? • Sabiendo de antemano sus
posibles efectos y con qué probabilidad • Y la recompensa en cada situación.

Un Proceso de Decisión de Markov viene definido por:

• Un conjunto S de estados (con un estado inicial s0)
• Para cada estado, un conjunto A(s) de acciones aplicables a ese estado.
• Un modelo de transición, dado por una distribución de probabilidad P(s s,a) para
cada par de estados s,s y acción a aplicable a s (indicando la probabilidad de que
aplicando a a s se obtenga s).
• Una función de recompensa R(s). Propiedad de Markov: el efecto (incierto) de
una acción sobre un estado sólo depende de la acción y del propio estado (y no de
estados anteriores)

2
Políticas
• En este contexto, una solución no puede ser una secuencia de acciones, ya que
el efecto de cada acción es incierto.
• Más bien buscamos una política que en cada posible estado recomiende una
acción a aplicar: por cada estado que pasemos, aplicamos la acción que nos
recomienda esa política

S, de manera que π(s) ∈ A(s)

• Formalmente: una política es una función π definida sobre el conjunto de estados

• Una misma política puede generar secuencias de acciones distintas (aunque

unas con más probabilidades que otras).
• Se busca la política óptima: aquella que maximice la recompensa media
esperada para las posibles secuencias de acciones que se puedan generar.

Ejemplo de políticas en la cuadrícula

3
Valoración de secuencia de estados en el tiempo:
• Supongamos que, mediante aplicación de una secuencia de acciones, se ha
generado una secuencia de estados q0q1q2 ···
• ¿Cómo valoramos una secuencia de estados? Idea: a partir de las
recompensas, pero penalizando el largo plazo
• Valoración mediante recompensa con descuento: V ([q0q1q2 ···]) = R(q0) + γ
R(q1) +γ2R(q2) +··· donde γ es el llamado factor de descuento
• En el ejemplo de la cuadrícula:
• Con γ =0.8, la secuencia de estados (1, 1), (2,1),(3,1),(3,2),(3,3),(3,4) tiene una
valoración −0.04−0.04·0.8−0.04·0.82−0.04·0.83−0.04·0.84+1·0.85 = 0.193216
Valoraciones de secuencias: Observaciones
• Suponemos horizonte infinito
• No hay un plazo fijo de terminación
• Procesos estacionarios: la política óptima a partir de un momento sólo depende
del estado en ese momento
• ¿Esto implica que las valoraciones pueden ser infinitas? En general, no:
• Si hay estados terminales, los asimilamos a estados a partir del cual las
recompensas son cero. •
Aún con posibles secuencias infinitas, si las recompensas están acotadas por una
cantidad Rmax y γ < 1, entonces la valoración de una secuencia no puede ser
mayor de Rmax/(1 −γ) (¿por qué?)
Valoración de estados respecto de una política
• Dada una política π y un estado s, podemos valorar s respecto de π teniendo en
cuenta la valoración de las secuencias de estados que se generan si se sigue
dicha política a partir de s
• Ejemplo: si en la cuadrícula estamos en el estado (1,4) y aplicamos la política (a)
del gráfico anterior, podríamos generar distintas secuencias, cada una con una
probabilidad y una valoración. Entre otras:
• (1,4), (1,3), (1,2), (1,1), (2,1), (3,1), (3,2), (3,3), (3,4), con probabilidad 0.88 =
0.168 y valoración 0.0013 (siendo γ =0.8 y R =−0.04)

4
• (1,4), (1,3), (2,3), (3,3), (3,4) con probabilidad 0.83 · 0.1 = 0.0512 y valoración
0.291 • (1,4), (1,3), (2,3), (2,4) con probabilidad 0.8 · 0.12 = 0.008 y valoración-
0.609 • (1,4), (2,4) con probabilidad 0.1 y valoración-0.84
Valoración de estados respecto de una política
• Idea: valorar un estado s respecto de una política π como la media esperada (es
decir, ponderada por su probabilidad) de las valoraciones de todas las secuencias
que se podrían obtener.
• En el ejemplo anterior: 0.168·0.0013+0.0512·0.291−0.008·0.609−0.1·0.84+···
• La valoración de un estado respecto de una política π la notamos por Vπ(s).

Cálculo de valoración respecto de una política (ejemplo)

En la política (a) de la cuadrícula en la figura anterior, éstas serían alguna de las
ecuaciones que salen:
• Vπ(1,1) = −0.04+γ·(0.8·Vπ(2,1)+0.1·Vπ(1,1)+0.1·Vπ(1,2))
• Vπ(1,2) = −0.04+γ ·(0.8·Vπ(1,1)+0.2·Vπ(1,2))
• Vπ(1,3) = −0.04+γ·(0.8·Vπ(1,2)+0.1·Vπ(1,3)+0.1·Vπ(2,3))
• ···
• Vπ(3,4) = +1 Resolviendo este sistema, obtenemos Vπ.

También podría gustarte

Procesos de Decisión Markovianos en Ingeniería
Aún no hay calificaciones
Procesos de Decisión Markovianos en Ingeniería
5 páginas
TransparenciasT12Urjc Ia
Aún no hay calificaciones
TransparenciasT12Urjc Ia
30 páginas
Modelos Markovianos y Funciones de Valor
Aún no hay calificaciones
Modelos Markovianos y Funciones de Valor
5 páginas
Metodos Aprendizaje Refuerzo
Aún no hay calificaciones
Metodos Aprendizaje Refuerzo
4 páginas
Modelos de Decisión Markovianos en Mantenimiento
Aún no hay calificaciones
Modelos de Decisión Markovianos en Mantenimiento
37 páginas
Modelos de Decisión en Procesos Markovianos
Aún no hay calificaciones
Modelos de Decisión en Procesos Markovianos
40 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
39 páginas
Fundamentos de Programación Dinámica
Aún no hay calificaciones
Fundamentos de Programación Dinámica
26 páginas
Introducción a Cadenas de Markov
100% (1)
Introducción a Cadenas de Markov
61 páginas
Modelos de Estados y Transiciones PDF
Aún no hay calificaciones
Modelos de Estados y Transiciones PDF
27 páginas
Procesos de Decisión de Markov
100% (1)
Procesos de Decisión de Markov
2 páginas
Modelos Gráficos Probabilistas
Aún no hay calificaciones
Modelos Gráficos Probabilistas
81 páginas
Introducción a Cadenas de Markov y Procesos Estocásticos
Aún no hay calificaciones
Introducción a Cadenas de Markov y Procesos Estocásticos
21 páginas
Introducción A Las Cadenas de Markov
Aún no hay calificaciones
Introducción A Las Cadenas de Markov
23 páginas
Optimización de Procesos Markovianos
Aún no hay calificaciones
Optimización de Procesos Markovianos
7 páginas
MDP Teoría
Aún no hay calificaciones
MDP Teoría
22 páginas
Método de Iteración de Políticas en MDP
Aún no hay calificaciones
Método de Iteración de Políticas en MDP
1 página
Iteración de políticas en lago congelado
Aún no hay calificaciones
Iteración de políticas en lago congelado
3 páginas
Examen 2025
Aún no hay calificaciones
Examen 2025
4 páginas
Trabajo de Investigacion
Aún no hay calificaciones
Trabajo de Investigacion
12 páginas
Procesos de Decisión de Markov: Guía Completa
Aún no hay calificaciones
Procesos de Decisión de Markov: Guía Completa
61 páginas
MDP y Aprendizaje por Refuerzo: Guía Completa
Aún no hay calificaciones
MDP y Aprendizaje por Refuerzo: Guía Completa
54 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
13 páginas
M3 - Procesos de Decisión de Markov
Aún no hay calificaciones
M3 - Procesos de Decisión de Markov
48 páginas
Taller de Cadenas de Markov en Operaciones
Aún no hay calificaciones
Taller de Cadenas de Markov en Operaciones
3 páginas
Modelo de Markov
Aún no hay calificaciones
Modelo de Markov
42 páginas
Cadenas de Markov: Definición y Aplicaciones
Aún no hay calificaciones
Cadenas de Markov: Definición y Aplicaciones
35 páginas
Ejercicios sobre Procesos de Decisión de Markov
Aún no hay calificaciones
Ejercicios sobre Procesos de Decisión de Markov
32 páginas
Introducción a Procesos de Decisión de Markov
Aún no hay calificaciones
Introducción a Procesos de Decisión de Markov
53 páginas
Actividad 9 - Cadenas de Markov - Carlos Agustin Hernandez Hernandez
Aún no hay calificaciones
Actividad 9 - Cadenas de Markov - Carlos Agustin Hernandez Hernandez
5 páginas
Análisis de Markov: Fundamentos y Ejemplos
Aún no hay calificaciones
Análisis de Markov: Fundamentos y Ejemplos
46 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
59 páginas
Avances de Economia y Finanzas - Cadenas de Markov
Aún no hay calificaciones
Avances de Economia y Finanzas - Cadenas de Markov
47 páginas
Juegos Dinámicos y Decisiones Incompletas
Aún no hay calificaciones
Juegos Dinámicos y Decisiones Incompletas
61 páginas
Procesos Estocásticos y Cadenas de Markov
Aún no hay calificaciones
Procesos Estocásticos y Cadenas de Markov
15 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
43 páginas
Decisiones Bajo Incertidumbre en Ingeniería
Aún no hay calificaciones
Decisiones Bajo Incertidumbre en Ingeniería
157 páginas
Introducción a Cadenas de Markov
83% (6)
Introducción a Cadenas de Markov
39 páginas
Procesos de Decision Markovianos
0% (1)
Procesos de Decision Markovianos
6 páginas
Cadenas de Markov: Conceptos y Aplicaciones
Aún no hay calificaciones
Cadenas de Markov: Conceptos y Aplicaciones
6 páginas
Introducción a las Cadenas de Markov
Aún no hay calificaciones
Introducción a las Cadenas de Markov
39 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
52 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
31 páginas
Introducción a Procesos Estocásticos
Aún no hay calificaciones
Introducción a Procesos Estocásticos
37 páginas
Procesos de Decisión de Markov y POMDP
Aún no hay calificaciones
Procesos de Decisión de Markov y POMDP
47 páginas
Cadenas de Markov
Aún no hay calificaciones
Cadenas de Markov
10 páginas
Gradientes de Política
Aún no hay calificaciones
Gradientes de Política
28 páginas
Introducción a Procesos de Decisión Markovianos
Aún no hay calificaciones
Introducción a Procesos de Decisión Markovianos
20 páginas
BPP3 (A)
Aún no hay calificaciones
BPP3 (A)
33 páginas
Introducción a las Cadenas de Markov
Aún no hay calificaciones
Introducción a las Cadenas de Markov
6 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
27 páginas
Optimización de Procesos Markovianos
Aún no hay calificaciones
Optimización de Procesos Markovianos
5 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
37 páginas
Tesis Arcenio Pecha
Aún no hay calificaciones
Tesis Arcenio Pecha
51 páginas
Cadenas de Markov
50% (2)
Cadenas de Markov
50 páginas
Matriz de Probabilidades de Transición en Análisis de Markov
Aún no hay calificaciones
Matriz de Probabilidades de Transición en Análisis de Markov
6 páginas
Análisis de Cadenas de Markov en Seguros
Aún no hay calificaciones
Análisis de Cadenas de Markov en Seguros
7 páginas
Características y Ejemplos de PD
100% (1)
Características y Ejemplos de PD
67 páginas
Identificación de Necesidades de Información Turística
Aún no hay calificaciones
Identificación de Necesidades de Información Turística
3 páginas
Claves de la Investigación de Mercados
Aún no hay calificaciones
Claves de la Investigación de Mercados
2 páginas
Manual Aplicación Color Lifting Anti Age Effect
100% (1)
Manual Aplicación Color Lifting Anti Age Effect
22 páginas
Manual Aplicación Color Lifting Anti Age Effect
100% (1)
Manual Aplicación Color Lifting Anti Age Effect
22 páginas
Propuesta para La Implementación de Un Proceso de Ensamble de Sillas en Carrocerías Superpolo S.A.S
100% (2)
Propuesta para La Implementación de Un Proceso de Ensamble de Sillas en Carrocerías Superpolo S.A.S
79 páginas
Impacto del Conflicto Laboral en Productividad
Aún no hay calificaciones
Impacto del Conflicto Laboral en Productividad
4 páginas
Examen Final Auditoría Informática CISA
Aún no hay calificaciones
Examen Final Auditoría Informática CISA
2 páginas
Identificacion de Estrategias
Aún no hay calificaciones
Identificacion de Estrategias
1 página
Diseño Urbano y Vialidad Efectiva
Aún no hay calificaciones
Diseño Urbano y Vialidad Efectiva
7 páginas
Mejora de Calidad en Procesos de Toma de Muestras
Aún no hay calificaciones
Mejora de Calidad en Procesos de Toma de Muestras
2 páginas
Segundo Bloque-Modelos de Toma de Decisiones
Aún no hay calificaciones
Segundo Bloque-Modelos de Toma de Decisiones
14 páginas
Normas sobre Estructuras de Construcción
Aún no hay calificaciones
Normas sobre Estructuras de Construcción
22 páginas
Guía Completa de Pintura con Diamantes
Aún no hay calificaciones
Guía Completa de Pintura con Diamantes
77 páginas
Modulo Introducción A La Salud Ocupacional, Dra. Monica Correa
Aún no hay calificaciones
Modulo Introducción A La Salud Ocupacional, Dra. Monica Correa
70 páginas
Guía de Pruebas de Hipótesis Estadísticas
100% (2)
Guía de Pruebas de Hipótesis Estadísticas
83 páginas
Diversidad Biológica Urbana en Antigua
Aún no hay calificaciones
Diversidad Biológica Urbana en Antigua
87 páginas
Informe de Laboratorio: Movimiento de Proyectiles
100% (1)
Informe de Laboratorio: Movimiento de Proyectiles
15 páginas
Revista Ecuador Debate #34
Aún no hay calificaciones
Revista Ecuador Debate #34
229 páginas
Test MINI-SEA de Reconocimiento Emocional
100% (1)
Test MINI-SEA de Reconocimiento Emocional
1 página
FT-SST-001 Formato Indicadores Del SG-SST - SERVINDUSTRIALES DEL HUILA
Aún no hay calificaciones
FT-SST-001 Formato Indicadores Del SG-SST - SERVINDUSTRIALES DEL HUILA
44 páginas
Proyección Social: Cuidado Ambiental 2014
Aún no hay calificaciones
Proyección Social: Cuidado Ambiental 2014
5 páginas
El Fantasma de Karl Marx: Análisis Dialéctico
Aún no hay calificaciones
El Fantasma de Karl Marx: Análisis Dialéctico
47 páginas
02 Memoria de Calculo Estructural MG Rev-04
Aún no hay calificaciones
02 Memoria de Calculo Estructural MG Rev-04
54 páginas
Plan de Curso Anual 1ro EMS
Aún no hay calificaciones
Plan de Curso Anual 1ro EMS
8 páginas
Guía de Uso del Sistema Orfeo
Aún no hay calificaciones
Guía de Uso del Sistema Orfeo
12 páginas
Textos Argumentativos: Amor, Esclavitud y Educación
Aún no hay calificaciones
Textos Argumentativos: Amor, Esclavitud y Educación
3 páginas
Distribuciones de Muestreo en Estadística
0% (1)
Distribuciones de Muestreo en Estadística
25 páginas
Urgente: Ley de Plásticos en Perú
Aún no hay calificaciones
Urgente: Ley de Plásticos en Perú
2 páginas
AMEF Coca Cola
100% (1)
AMEF Coca Cola
72 páginas
Efectos de PM10 en la Salud en La Paz
Aún no hay calificaciones
Efectos de PM10 en la Salud en La Paz
51 páginas
Lengua y Literatura 1 ESO - Contexto Digital - Adaptación Curricular Solucionario
90% (10)
Lengua y Literatura 1 ESO - Contexto Digital - Adaptación Curricular Solucionario
99 páginas
Proceso de Educción
Aún no hay calificaciones
Proceso de Educción
52 páginas
Análisis del Eslogan Político
Aún no hay calificaciones
Análisis del Eslogan Político
2 páginas
SISTEMAS DIGITALES y Tecnología de Computadores. Angulo Usategui.
100% (8)
SISTEMAS DIGITALES y Tecnología de Computadores. Angulo Usategui.
533 páginas
Revisión Cuestionario 2 de Geografía
Aún no hay calificaciones
Revisión Cuestionario 2 de Geografía
12 páginas
Números Irracionales
100% (1)
Números Irracionales
8 páginas