0% encontró este documento útil (0 votos)

93 vistas21 páginas

Teoría y Proceso de Toma de Decisiones

Este documento presenta una introducción a la teoría de la toma de decisiones. Explica las fases del proceso de toma de decisiones, los tipos de ambientes de decisión (certeza, riesgo e incertidumbre), y los modelos MaxiMax, MaxiMin y el criterio de Hurwicz para la toma de decisiones bajo incertidumbre. Finalmente, da un ejemplo numérico para ilustrar cómo aplicar estos modelos para seleccionar el mejor medio de comunicación para una campaña publicitaria.

Cargado por

Osvaldo Chacin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

93 vistas21 páginas

Teoría y Proceso de Toma de Decisiones

Cargado por

Osvaldo Chacin

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD ALONSO DE OJEDA

VICERRECTORADO ACADÉMICO

FACULTAD DE INGENIERÍA

ESCUELA INDUSTRIAL

INVESTIGACION DE OPERACIONES 2

Evaluación Actividad Unidad III

ESTUDIANTE:

Osvaldo Chacín

27.260.659

Sección: II0712

Ciudad Ojeda, Mayo 2022

Introducción.

En la vida cotidiana regularmente nos enfrentamos a situaciones conflictivas o

dilemas que exigen tomar decisiones, esta necesidad ocurre cuando se tienen dos
o más alternativas que presentan condiciones de incertidumbre para dar solución
a una situación que se presenta.

Con el fin de conocer este proceso se propone recurrir a la teoría de decisiones la

cual se ocupa de analizar cómo elige una persona aquella acción que, de entre un
conjunto de acciones posibles, lo conduce al mejor resultado dadas sus
preferencias.

Conforme aumenta la complejidad del ser vivo, aumenta también la complejidad

de sus decisiones y la forma en que éstas se toman. Así, pasamos de una toma
de decisiones guiada instintivamente, a procesos de toma de decisiones que
deben estar guiados por un pensamiento racional en el ser humano. La Teoría de
la Decisión tratará, por tanto, el estudio de los procesos de toma de decisiones
desde una perspectiva racional.
Teoría de decisión.

La teoría de la decisión se ocupa de analizar cómo elige una persona aquella

acción que, de entre un conjunto de acciones posibles, le conduce al mejor
resultado dadas sus preferencias. La teoría de la decisión es un método para la
toma de decisiones que se caracteriza por hacer elecciones de forma coherente
cuando se presentan varias opciones.

Fases del proceso de toma de decisiones.

Existe una serie de fases o etapas del proceso de toma de decisiones que son
vitales para lograr mayor efectividad. Sobre todo cuando lo que se desea es
encontrar soluciones eficientes a determinadas condiciones. Para ello, nada mejor
que el desarrollo de estas y su posterior comprensión. Facilitando dicho proceso.

1. Identificar el problema: En primer lugar, para gestionar como es debido el

proceso de toma de decisiones, lo más importante es detectar el problema.
Conocer la problemática y las distintas opciones para solucionarla será el
punto de inflexión para analizar el motivo que se nos presenta y conocer su
naturaleza. Solo de este modo se sabrá si la situación se puede considerar
un problema y plantearte cómo resolverlo.

2. Identificación de los criterios para llevar a cabo el proceso de toma de

decisiones: Señala la pauta que te ayudará a resolver el problema.
Siempre existen diversos métodos que favorecen la toma de decisiones en
una empresa, sólo hay que identificarlos. Los responsables de tomar
decisiones en una empresa saben que tienen un amplio abanico de
posibilidades para afrontar esa problemática. De entre todas ellas, deben
saber identificar cuáles serán las mejores y las que aportarán un beneficio
mayor para la compañía.

3. Ponderación de criterios: Los criterios seleccionados para gestionar el

proceso de toma de decisiones deben ser ponderados para conocer cuáles
son los más eficientes para la toma de decisiones final. Sabrás cual es el
mejor porque se postulará como el preferente.

4. Detección y análisis de alternativas: En algunos casos, en el proceso de

toma de decisiones, se puede dar el caso de que la ponderación de las
opciones posibles no sean las más adecuadas. En este caso, se puede
abrir la veda a alternativas factibles que sean capaces de ofrecer una
solución. La persona responsable de adoptar la resolución debe estudiar las
posibles alternativas. Hay que estar en conocimiento de los puntos fuertes y
los débiles de cada una de ellas. Se deben analizar y comparar para poder
esclarecer si verdaderamente pueden ser una alternativa viable.

5. Selección de una alternativa: Una vez conocidas y evaluadas las

alternativas, llega el momento de decidir cuál opción escoger. Se escogerá
la mejor opción para el buen funcionamiento y el rendimiento de la
empresa.

6. Implantación de la decisión: El primer paso es comunicarla a las

personas afectas y conseguir que la acepten. Esto será más sencillo si las
personas encargadas de llevarla a cabo o de acotarla forman parte del
proceso de toma de decisiones. Pero hay que recordar que la decisión final
también debe responder y respetar la planificación empresarial, la
organización y la dirección organizativa.

7. Evaluación de esta: Una vez seleccionada e implantada la solución, llega

el momento de evaluarla. Conocer cómo ha sido adoptada y, lo más
importante, si ha corregido el problema. Por último, es conveniente realizar
un estudio que analice y documente cómo se ha procedido a la toma de
esta decisión. Para determinar una correcta evaluación, se pueden seguir
estos pasos.
 Objetivos resueltos. El proceso de toma de decisiones se habrá
terminado satisfactoriamente si este cumple con las expectativas
esperadas. También es importante saber si las partes implicadas han
aceptado positivamente el reto.

 Analítica e informe de seguimiento. Es conveniente realizar un

informa final donde se determinen los factores que han intervenido
en el proceso de toma de decisiones y como han influido.

 Otros apuntes. Añade a tus estadísticas empresariales los métodos

utilizados, así como introducir los datos recopilados y estudiados
para futuros procedimientos. Resulta muy útil tener catalogado
cualquier paso para el futuro.
Tipos de ambientes en el proceso de toma de decisiones.

El nivel de información determina el tipo de ambiente de la decisión. Según Perez

Gorostegui los ambientes de decisión son los siguientes:

1. Certeza: El ambiente de certeza es aquél en el que el decisor conoce con

absoluta seguridad los estados de la naturaleza que van a presentarse.
Conocido el estado de la naturaleza que se va a presentar, el problema se
reduce a valorar en términos económicos los diferentes desenlaces y elegir
aquella estrategia que conduce al resultado más favorable.

2. Riesgo: Es aquél en el que el decisor sabe qué estados de la naturaleza se

pueden presentar y la probabilidad que tiene cada uno de ellos de
presentarse.

3. Incertidumbre: En este ambiente existe escasa información y para tomar la

decisión se basará en la mera intuición. Se dividen en:

 Incertidumbre estructurada: Es aquél en el que se conocen los

estados de la naturaleza, pero no la probabilidad de cada uno de
ellos.

 Incertidumbre no estructurada: Aquél en el que ni siquiera se

conocen los posibles estados de la naturaleza.

Proceso de toma de decisiones bajo incertidumbre.

Todos los modelos en condiciones de incertidumbre resultan adecuados en

situaciones en las cuales el decisor tiene poca confianza en su capacidad para
juzgar las probabilidades de los diversos estados de la naturaleza o no existe un
experto que realice esta tarea, también sirven en situaciones en las que es
deseable considerar el análisis del peor caso o del mejor, independientemente de
su probabilidad de ocurrencia.

Su análisis también se basa en el planteamiento de una matriz de pagos, pero a

diferencia del Valor Esperado, las probabilidades de ocurrencia de los estados de
la naturaleza, son desconocidas.

MaxiMax y MaxiMin.

Estos modelos matemáticos se basan en la personalidad del decisor, ya sea que

éste adopte una posición optimista o pesimista a la hora de decidir.
 Desde un punto de vista optimista, se elige la opción que mejores
resultados brinde. En el caso de beneficios, se utiliza el MaxiMax, que
representa el máximo de los máximos y para costos, se utiliza el MiniMin,
que significa el mínimo de los mínimos.
 Desde un punto de vista pesimista, se elige la mejor opción de entre las
peores que podrían suceder. Para un problema de utilidades, el modelo
adecuado es el MaxiMin, es decir se elige el valor máximo de entre los
mínimos y en el caso de los costos es el MiniMax, que sugiere elegir el
valor mínimo de entre los máximos.

Ejemplo.

Supongamos que una empresa quiere realizar una campaña publicitaria. Se le

presentan 3 posibilidades: radio (15 minutos de lunes a jueves en un espacio), TV
(1 spot cada semana sobre las 12h) y prensa (1 anuncio 2 días a la semana los
lunes y los jueves). Como han hecho campañas anteriormente se han podido
valorar los beneficios de las diferentes posibilidades del siguiente modo:

¿Qué medio de comunicación se debería elegir?

Resolución:

Como la matriz de pagos es de utilidades, entonces se utilizarán los modelos

MaxiMax y MaxiMin.

 Optimista: MaxiMax. De cada una de las alternativas de la matriz de

decisión (filas) se escoge el mayor valor, y de estos nuevamente se escoge
el valor más alto:

 Pesimista: MaxiMin. De cada una de las alternativas de la matriz de

decisión (filas) se escoge el menor valor, y de estos se escoge el valor más
alto:
Conclusión: Tomando en cuenta una actitud positiva, el medio más adecuado para
realizar la campaña publicitaria sería la radio. En el caso de los pesimistas, la
prensa sería el medio más seguro.

Criterio de realismo o Hurwicz.

Es un criterio intermedio entre el criterio maximax y el maximín. Para evitar el

conservadurismo del maximín y el optimismo del maximax, Hurwicz propuso un
criterio que equivale a la suma ponderada de los resultados extremos de ambas
líneas de acción. Puesto que nadie es siempre optimista o siempre pesimista, el
criterio de Hurwicz establece una vía intermedia entre el maximín y el maximax.
Así, por ejemplo, si alguien otorga a los peores resultados de A y B un valor a =
3/4, y de 1/4 (es decir, 1-a) a los mejores resultados, el criterio de Hurwicz valorará
las distintas líneas de acción de la siguiente manera:

Igualdad de probabilidades o Laplace.

Este método supone que todos los diversos estados de la naturaleza tienen igual
probabilidad de ocurrencia, o sea que es probable que ocurran todos los estados
de la naturaleza.

El criterio de Laplace sí considera, en cambio, todos los valores. Puesto que no

tenemos información sobre la probabilidad de que ocurra C, D o E, lo más racional
sería, según este criterio, asignarle a cada valor la misma probabilidad y elegir el
que nos dé el mayor valor esperado (la mayor utilidad esperada). De esta forma
obtendríamos los siguientes resultados para A y B:

Proceso de toma de decisiones bajo riesgo.

La toma de decisión bajo condición de riesgo se da cuando existe conocimiento de

la probabilidad que un estado de la naturaleza ocurra; es decir el decidor debe
prever la probabilidad de ocurrencia de cada uno de estos estados.
Normalmente, las probabilidades de ocurrencia de los estados de la naturaleza se
conoce mediante la determinación de la frecuencia con que dichos estados
ocurrieron en el pasado; o mediante criterios personales o subjetivos.

Valor monetario esperado.

El valor monetario esperado es un valor basado en la probabilidad que tiene en

cuenta todos los resultados monetarios posibles de una situación dada. El valor se
alcanza multiplicando el porcentaje de cada posibilidad que ocurre por la pérdida o
ganancia monetaria asociada con ese resultado. En ese punto, todos esos
valores, positivos y negativos, se combinan para alcanzar el valor monetario
esperado. Este cálculo es una herramienta valiosa para quienes tienen la tarea de
tomar una decisión que implique varios resultados posibles, ya que representa la
estimación estadísticamente más precisa del resultado final.

Ejemplo: Si un proyecto de negocio tiene 80% de probabilidad de generar

ganancias de $50,000 y un 15% de probabilidad de generar pérdidas de $25,000,
¿Cuál es el EMV del proyecto?

$50,000*80%= $40,000

$25,000*15%= -$3,750

EMV= $ 36,250

Valor esperado de la información.

El valor esperado con la información perfecta (VECIP) es el rendimiento esperado

o promedio, a largo plazo, si es que se tiene información perfecta antes de que se
deba de tomar la decisión. Para calcular este valor se elige la mejor alternativa de
cada estado de la naturaleza y se multiplica su ganancia por la probabilidad de
que ocurra ese estado de la naturaleza.

Donde  = probabilidad y  =Mejor pago del estado de la naturaleza

Se escoge la mejor opción de cada columna para encontrar el VECIP tal como se
muestra a continuación:
El valor esperado de la información perfecta (), es el valor esperado con
información perfecta menos el valor esperado sin la información perfecta
(VMEmax).

De los cálculos anteriores se tiene que Valor Monetario Esperado 𝑉𝑀𝐸𝑚𝑎𝑥 es

40000 y el cálculo de VECIP fue 100000 así el cálculo del valor esperado de la
información perfecta se obtiene como sigue:

Así, lo máximo que se estaría dispuesto a pagar por información perfecta es

60000.

Perdida de oportunidad esperada.

La pérdida de oportunidad esperada (POE) es un cálculo estadístico usado

principalmente en el campo de los negocios para ayudar a determinar el curso de
acción óptimo.

Es el valor de una pérdida como consecuencia de que una compañía genere un

impago. En otras palabras, el valor que representa un impago en un horizonte
temporal determinado, una probabilidad de incumplimiento específica, así como un
nivel de exposición precisado.

Paran un mejor entendimiento, debemos saber que: primeramente, se toman lo

peor del mercado favorable, así como lo de mercado desfavorable, de las
opciones dadas; enseguida lo peor de lo restante, y, por último, lo peor de lo
restante; tal como se muestra en la tabla. La decisión a tomar es la alternativa 2.
Construir una “fábrica grande”.

Arboles de decisión.

Un árbol de decisión es un mapa de los posibles resultados de una serie de

decisiones relacionadas. Permite que un individuo o una organización comparen
posibles acciones entre sí según sus costos, probabilidades y beneficios. Se
pueden usar para dirigir un intercambio de ideas informal o trazar un algoritmo que
anticipe matemáticamente la mejor opción.

1. Comienza con la decisión principal. Dibuja un pequeño recuadro para

representar este punto, luego dibuja una línea desde el recuadro hacia la
derecha para cada posible solución o acción. Etiquétalas correctamente.

2. Agrega nodos de decisión y probabilidad para expandir el árbol del

siguiente modo:

 Si otra decisión es necesaria, dibuja otro recuadro.

 Si el resultado es incierto, dibuja un círculo (los círculos representan nodos

de probabilidad).

 Si el problema está resuelto, déjalo en blanco (por ahora).

Desde cada nodo de decisión, dibuja soluciones posibles. Desde cada nodo de
probabilidad, dibuja líneas que representen los resultados posibles. Si deseas
analizar tus opciones de forma numérica, incluye la probabilidad de cada resultado
y el costo de cada acción.

3. Continúa con la expansión hasta que cada línea alcance un extremo, lo

que significa que no hay más decisiones que tomar o resultados probables
que considerar. Luego, asigna un valor a cada resultado posible. Puede ser
una puntuación abstracta o un valor financiero. Agrega triángulos para
indicar los extremos.

Con un árbol de decisión completo, ya estás listo para comenzar a analizar la

decisión que enfrentas.

Teoría de la utilidad.

La teoría de la utilidad trata de explicar el comportamiento del consumidor. Desde

esta perspectiva se dice que la utilidad es la aptitud de un bien para satisfacer las
necesidades. Así un bien es más útil en la medida que satisfaga mejor una
necesidad. Esta utilidad es cualitativa (las cualidades reales o aparentes de los
bienes), es espacial (el objeto debe encontrarse al alcance del individuo) y
temporal (se refiere al momento en que se satisface la necesidad).

Esta teoría parte de varios supuestos:

 El ingreso del consumidor por unidad de tiempo es limitado.

 Las características del bien determinan su utilidad y por tanto afectan las
decisiones del consumidor.

 El consumidor busca maximizar su satisfacción total (utilidad total), y por

tanto gasta todo su ingreso.

 El consumidor posee información perfecta, es decir, conoce los bienes (sus

características y precios).

 El consumidor es racional, esto quiere decir que busca lograr sus objetivos,
en este caso trata de alcanzar la mayor satisfacción posible. Esto quiere
decir que el consumidor es capaz de determinar sus preferencias y ser
consistente en relación con sus preferencias. Así, si el consumidor prefiere
el bien A sobre el bien B y prefiere el bien B sobre el bien C, entonces
preferirá el bien A sobre el bien C (transitividad).

La teoría económica del comportamiento del consumidor se topa con un problema

importante (llamado el problema central de la teoría del consumidor), el cual es la
imposibilidad de cuantificar el grado de satisfacción o utilidad que el consumidor
obtiene de los bienes. No existe una unidad de medida objetiva de la satisfacción.
Este problema se ha enfrentado a través de dos enfoques distintos:

 Enfoque cardinal: Supone que si es posible medir la utilidad, o sea que si se

dispone de una unidad de medida de la satisfacción.

 Enfoque ordinal: En este enfoque el consumidor no mide la utilidad, sólo

establece combinaciones de bienes que prefiere o le son indiferentes con
respecto a otras combinaciones de bienes.

Enfoque cardinal:

A partir de los supuestos y conceptos mencionados se definen dos conceptos de

utilidad o satisfacción:

 Utilidad Total: es la satisfacción total de consumir una cierta cantidad de un

bien.

 Utilidad Marginal: es la satisfacción extra de una unidad de consumo

adicional.

Ejemplo: Suponga que un consumidor percibe los siguientes niveles de utilidad

total y marginal por el consumo de chocolates:
Graficando ambos conceptos:
En los datos anteriores se observa que se satisface la LEY DE LA UTILIDAD
MARGINAL DECRECIENTE, es decir, la satisfacción adicional del consumidor
disminuye a medida que se consume una mayor cantidad del bien. Observe que
hay un punto de inflexión, a partir del cual la utilidad marginal (UM) se vuelve
decreciente:

¿Cuánto debe comprar el consumidor?

Para responder a esa pregunta es

necesaria más información:

 El ingreso del consumidor.

 La utilidad que obtiene por los demás bienes alternativos.

Supóngase que el consumidor puede comprar dos bienes A y B. Entonces deben

cumplirse dos condiciones para maximizar la satisfacción total:

1. El consumidor gasto todo su ingreso: restricción presupuestaria:

I = Pa· Qa + Pb · Qb

2. El consumidor maximiza su utilidad total: condición de equimarginalidad:

Proceso de decisión de Markov.

Un proceso de decisión de Markov (en inglés Markov decision process , CDM) es

un modelo estocástico donde un agente toma decisiones y donde los resultados
de sus acciones son aleatorios. Los MDP se utilizan para estudiar problemas de
optimización mediante algoritmos de programación dinámica o aprendizaje por
refuerzo.

Para entender qué es un MDP, supongamos que tenemos un sistema que

evoluciona con el tiempo como un autómata probabilístico. En cada instante, el
sistema está en un estado dado y existe una cierta probabilidad de que el sistema
evolucione hacia tal o cual otro estado en el siguiente instante haciendo una
transición.

Ahora suponga que necesitamos controlar este sistema de caja negra de la mejor
manera posible. El objetivo es llevarlo a un estado considerado beneficioso,
evitando que pase por estados dañinos. Para ello, disponemos de un conjunto de
posibles acciones en el sistema. Para complicar las cosas, asumiremos que el
efecto de estas acciones en el sistema es probabilístico: la acción tomada puede
tener el efecto deseado o algún otro efecto. La eficacia del control se mide en
relación con la ganancia o la penalización recibida a lo largo del experimento.

Así, el razonamiento basado en MDP se puede reducir al siguiente

discurso: estando en tal caso y eligiendo tal o cual acción, hay tantas posibilidades
de que me encuentre en un caso tan nuevo con tal ganancia.

Propiedad de Markov.

La propiedad de Markov nos muestra que el futuro es independiente del pasado,

dado el presente, lo cual se expresa en la siguiente formula:

La cual significa que el estado actual (representado por Sₜ) contiene toda la
información relevante de los estados pasados (S₁,….. Sₜ), por lo tanto ya no nos
serviría tener mayor información de los estados pasados.

Matriz de transición de estados.

Ahora pasaremos a ver la llamada matriz de transición de estados, la cual nos
muestra cual sería la probabilidad de transición desde un estado S a un estado S’
y en donde cada fila sumaría uno, se vería de la siguiente manera, estos
conceptos serán mostrados en un ejemplo más adelante.

Simplificando, un proceso de Markov es un proceso sin memoria y aleatorio; en

otras palabras es una secuencia de estados aleatorios que posee la propiedad de
Markov.

Se podría definir el proceso de Markov como una tupla <S, P>

 S es una lista de estados a los cuales puede pertenecer.

 P es una matriz de transición de estado.

Modelos de programación dinámica de etapa finita e infinita.

La programación dinámica, es una técnica que permite la resolución de problemas

que tratan de alcanzar determinados fines, a través, de una serie de etapas o
fases compuestas de diversos estados, de estos es necesario hacer una elección,
de tal manera que se alcance la máxima efectividad global, también podemos
decir, que es una técnica matemática que trata con la optimización de procesos de
decisión. La optimización es por fases en vez de simultánea.

Horizonte finito: el agente trata de optimizar su recompensa esperada en los

siguientes h pasos, sin preocuparse de lo que ocurra después:

donde rt significa la recompensa recibida t pasos en el futuro. Este modelo se

puede usar de dos formas: (i) política no estacionaria: donde en el primer paso se
toman los siguientes h pasos, en el siguiente los h − 1, etc., hasta terminar. El
problema principal es que no siempre se conoce cuántos pasos considerar.
Horizonte infinito: las recompensas que recibe un agente son reducidas
geométricamente de acuerdo a un factor de descuento γ (0 ≤ γ < 1) considerando
un número infinito de pasos:

Modelo de etapa infinita: método de enumeración exhaustiva.

Consiste en enumerar todas las soluciones posibles, a partir de los valores

tomados para las variables enteras y realizar todas las combinaciones posibles
hasta encontrar una combinación que nos proporcione el valor óptimo de la
función objetivo y que cumpla con todas las restricciones del problema. Una de las
objeciones principales que presenta este método es el número de variables, ya
que se presentan demasiadas combinaciones antes de encontrar la solución
óptima. Ejemplo: MAX Z = 3 X1+ 5 X2 Sujeta a:

Solución: Posibles valores enteros de X1, según la restricción X1+X2

8: X1 = 0, 1, 2, 3, 4, 5, 6, 7, 8

Posibles valores enteros de X1, según la restricción3 X1 + 2 X2

7: X1= 0, 1, 2

Entonces X1= 0, 1, 2 Posibles valores enteros de X2, según la restricción X1 + X2

Posibles valores enteros de X2, según la restricción 3 X1 + 2 X2

X2 =

0, 1, 2, 3, 4, 5, 6, 7, 8

7: X2= 0, 1, 2, 3

Método de iteración de política con descuento.

El algoritmo de iteración de política se puede ampliar para abarcar descuentos.

Dado el factor de descuento α (< 1), la ecuación recursiva de etapas finitas se
puede plantear como sigue:
(Nótese que η representa la cantidad de etapas que faltan.) Se puede demostrar
que cuando η→∞ (modelo infinito), fη(i) =f (i), siendo f (i) el ingreso a valor
presente (descontado), si el sistema está en el estado i y funciona durante un
horizonte infinito. Así, el comportamiento de fη(i) a largo plazo, cuando η→∞ es
independiente del valor de η. Esto contrasta con el caso donde no hay
descuentos, en el que fη(i)=ηE +f (i). Cabría esperar este resultado, porque al
descontar, el efecto de los ingresos futuros disminuye a cero, en forma asintótica.
En realidad, el valor presente f (i) debe tender a un valor constante cuando η→∞.
Con base en esta información, se modifican como sigue los pasos de iteración de
política. Paso de determinación de valor. Para una política arbitraria s con matrices
Ps y Rs, resolver las m ecuaciones

Método de iteración política sin descuento.

El método de enumeración exhaustiva no es práctico para problemas grandes. El

método de iteración de política, que está basado en la ecuación recursiva de PD
es, según se demuestra, más eficiente en términos de cálelo que el método de
enumeración exhaustiva, ya que normalmente converge en un número de
iteraciones pequeño. El método de iteración de política está basado
principalmente en el desarrollo siguiente. Para cualquier política específica, el
rendimiento total esperado en la etapa n se expresa a través de la ecuación
recursiva

Esta ecuación recursiva es la base para el desarrollo del método de iteración de

política. Sin embargo, la forma presente se debe modificar ligeramente de manera
que nos permita estudiar la conducta asintótica del proceso.

Problemas de decisión de Márkov

Son la forma idealizada matemáticamente del problema de aprendizaje por

refuerzo, para el cual se podría encontrar un enunciado teórico preciso que pueda
describirla, en otras palabras, los MDP describen formalmente el medio ambiente
en el cual se desarrolla el RL, donde el medio ambiente es completamente
observable, esto da como consecuencia que la mayoría de problemas dentro del
RL se pueden formalizar como MDPs. Con los MDP se introducen varios
elementos clave para la descripción matemática del problema, como el retorno,
funciones de valor y las ecuaciones de Bellman.

Un ejemplo de este es el siguiente:

Una empresa está considerando utilizar Cadenas de Markov para analizar los
cambios en las preferencias de los usuarios por tres marcas distintas de un
determinado producto. El estudio ha arrojado la siguiente estimación de la matriz
de probabilidades de cambiarse de una marca a otra cada mes:

Si en la actualidad la participación de mercado es de 45%, 25% y 30%,

respectivamente. ¿Cuáles serán las participaciones de mercado de cada marca en
dos meses más?

En primer lugar definimos la variable aleatoria X_{n} que representa la marca que
adquiere un cliente cualquiera en el mes n. Dicha variable aleatoria puede adoptar
los valores 1,2,3 en el mes n=0,1,2,3,..

Adicionalmente conocemos cuál es la distribución inicial y la matriz de

probabilidades de transición en una etapa tal como se observa a continuación:

Luego para conocer la distribución de las participaciones de mercado al cabo de 2

meses (2 etapas) podemos utilizar la fórmula
Se concluye que las cuotas de mercado (participaciones de mercado) en dos
meses ha cambiado de un 45% a un 40.59%; de un 25% a un 33.91% y de un
30% a un 25.50%, para las marcas 1,2 y 3 respectivamente.
Conclusión.

Un ingeniero industrial tiene que familiarizarse con el circuito básico de toma de

las decisiones y sus ingredientes. Una vez reconocidos estos ingredientes
básicos, debe prestarse atención al carácter de quien toma la decisión, tanto
individualmente como en grupo. Debido a que la mayoría de las decisiones tienen
efecto sobre la gente, el Gerente no puede ignorar la influencia de las relaciones
humanas en una decisión, especialmente cuando se selecciona una técnica para
tomarla.

La representación en diagrama de un problema dado puede tomar diferentes

formas y puede ser una ayuda invaluable para reunir y mostrar el problema en
particular o los parámetros de la decisión. Un conocimiento básico de las teorías
de las probabilidades y de la estadística ayudará en la presentación gráfica de
esta información.

Sin embargo, una vez que se haya procesado toda la información y al mismo
tiempo comprendido cuáles son los ladrillos básicos para la construcción de la
toma de decisiones, aún se requiere un ingrediente más para que un Gerente
tome las decisiones acertadas.

La persona que no desee correr riesgos nunca tendrá éxito como ingeniero y más
aún si desea convertirse en un gerente. Un Gerente debe tener el buen juicio para
saber qué tanta información debe recoger, la inteligencia para dirigir la información
y, lo más importante de todo, el valor para tomar la decisión que se requiere
cuando ésta conlleva un riesgo. La cualidad personal del valor para aceptar la
responsabilidad de una decisión (sea ésta buena o mala) separa a las personas
ordinarias de quienes toman decisiones excelentes.

También podría gustarte

Toma de decisiones: certeza, riesgo e incertidumbre
Aún no hay calificaciones
Toma de decisiones: certeza, riesgo e incertidumbre
10 páginas
Inteligencia Militar a lo Largo de la Historia
Aún no hay calificaciones
Inteligencia Militar a lo Largo de la Historia
19 páginas
Encuesta sobre Posesión de Armas en México
Aún no hay calificaciones
Encuesta sobre Posesión de Armas en México
19 páginas
Interoperabilidad en el Sector Público Boliviano
Aún no hay calificaciones
Interoperabilidad en el Sector Público Boliviano
94 páginas
Manual de Comercio Exterior y Derecho Aduanero
Aún no hay calificaciones
Manual de Comercio Exterior y Derecho Aduanero
135 páginas
Convocatoria Sat Agente Aduanal
100% (2)
Convocatoria Sat Agente Aduanal
4 páginas
Interoperabilidad en Operaciones Multinacionales
Aún no hay calificaciones
Interoperabilidad en Operaciones Multinacionales
21 páginas
Martin Miguel, 2020 - Los Principios de Fayol y Las Funciones Básicas de La Empresa
Aún no hay calificaciones
Martin Miguel, 2020 - Los Principios de Fayol y Las Funciones Básicas de La Empresa
10 páginas
Inducción del OCE en la Administración Pública
Aún no hay calificaciones
Inducción del OCE en la Administración Pública
12 páginas
25 LATAM Regional Threat Landscape Report 12 Partner Co Brandable 12 Es LA
Aún no hay calificaciones
25 LATAM Regional Threat Landscape Report 12 Partner Co Brandable 12 Es LA
44 páginas
Marco Jurídico de la SEDENA 2024
Aún no hay calificaciones
Marco Jurídico de la SEDENA 2024
87 páginas
DNC - 2.01.3 Jipoe. Ene 2013
Aún no hay calificaciones
DNC - 2.01.3 Jipoe. Ene 2013
87 páginas
Informe sobre la Guardia Nacional en México
Aún no hay calificaciones
Informe sobre la Guardia Nacional en México
151 páginas
Geopolítica y Seguridad Nacional
50% (2)
Geopolítica y Seguridad Nacional
2 páginas
Drones en Gestión de Riesgos del Ejército
Aún no hay calificaciones
Drones en Gestión de Riesgos del Ejército
29 páginas
ATP 2-01.3 IPB Preparación de Inteligencia para El Campo de Batalla (MAR 2019) .
100% (1)
ATP 2-01.3 IPB Preparación de Inteligencia para El Campo de Batalla (MAR 2019) .
228 páginas
Amenazas Híbridas: Mitos y Realidades
100% (1)
Amenazas Híbridas: Mitos y Realidades
14 páginas
Formato Testamento
Aún no hay calificaciones
Formato Testamento
3 páginas
La Economia de Yucatan
Aún no hay calificaciones
La Economia de Yucatan
6 páginas
Proceso Militar en Decisiones Gerenciales
Aún no hay calificaciones
Proceso Militar en Decisiones Gerenciales
24 páginas
MANUAL DEL COMITÉ DE GESTIÓN DE RIESGOS Junio Del 2014
Aún no hay calificaciones
MANUAL DEL COMITÉ DE GESTIÓN DE RIESGOS Junio Del 2014
102 páginas
Procesos de Decision Markovianos
0% (1)
Procesos de Decision Markovianos
6 páginas
Uso Psicológico de Armas en Policía
Aún no hay calificaciones
Uso Psicológico de Armas en Policía
38 páginas
Estudio Del Terreno Militar Picb Dia 1
Aún no hay calificaciones
Estudio Del Terreno Militar Picb Dia 1
178 páginas
Manual de Liderazgo y Entrenamiento
Aún no hay calificaciones
Manual de Liderazgo y Entrenamiento
46 páginas
Teoría de la Toma de Decisiones en Empresas
100% (1)
Teoría de la Toma de Decisiones en Empresas
20 páginas
Curso de Tiro Defensivo Nivel 2 Pag Web
Aún no hay calificaciones
Curso de Tiro Defensivo Nivel 2 Pag Web
2 páginas
Doctrina para Operaciones Aéreas Conjuntas
Aún no hay calificaciones
Doctrina para Operaciones Aéreas Conjuntas
134 páginas
Poder Militar 2 Daed
100% (1)
Poder Militar 2 Daed
386 páginas
Estado Del Arte y Marco Teórico
Aún no hay calificaciones
Estado Del Arte y Marco Teórico
4 páginas
Análisis de la Guardia Nacional en México
Aún no hay calificaciones
Análisis de la Guardia Nacional en México
18 páginas
Análisis de Terreno y Consideraciones Civiles
Aún no hay calificaciones
Análisis de Terreno y Consideraciones Civiles
30 páginas
Modelo de Markov
Aún no hay calificaciones
Modelo de Markov
42 páginas
Ejercicios Avanzados de Estadística
100% (1)
Ejercicios Avanzados de Estadística
6 páginas
Estadística Inferencial en Administración
Aún no hay calificaciones
Estadística Inferencial en Administración
6 páginas
Prueba de Hipótesis en Estadística Aplicada
Aún no hay calificaciones
Prueba de Hipótesis en Estadística Aplicada
2 páginas
Hojas de Presentación Creativas
Aún no hay calificaciones
Hojas de Presentación Creativas
8 páginas
Glosario de Seguridad Nuclear OIEA 2022
Aún no hay calificaciones
Glosario de Seguridad Nuclear OIEA 2022
336 páginas
Inteligencia Geoespacial en el Ejército
Aún no hay calificaciones
Inteligencia Geoespacial en el Ejército
5 páginas
Seguridad y Ciberguerra en el Siglo XXI
Aún no hay calificaciones
Seguridad y Ciberguerra en el Siglo XXI
5 páginas
Importancia y Métodos de Estadística
Aún no hay calificaciones
Importancia y Métodos de Estadística
9 páginas
Principios de Logística Conjunta Moderna
Aún no hay calificaciones
Principios de Logística Conjunta Moderna
366 páginas
La Preparación de Inteligencia Delcampo de Batalla
Aún no hay calificaciones
La Preparación de Inteligencia Delcampo de Batalla
4 páginas
Tesis
Aún no hay calificaciones
Tesis
226 páginas
2014 - Reguant&Martinez - Operacionalización de Conceptos Variables PDF
Aún no hay calificaciones
2014 - Reguant&Martinez - Operacionalización de Conceptos Variables PDF
10 páginas
Inteligencia Naval en Chile: Historia y Evolución
Aún no hay calificaciones
Inteligencia Naval en Chile: Historia y Evolución
38 páginas
Introducción a Cadenas de Markov
Aún no hay calificaciones
Introducción a Cadenas de Markov
6 páginas
Componentes de la Inteligencia Estratégica
Aún no hay calificaciones
Componentes de la Inteligencia Estratégica
4 páginas
Presupuestos para El Desarrollo en América Latina
Aún no hay calificaciones
Presupuestos para El Desarrollo en América Latina
401 páginas
Plan DN-III-E: Auxilio en Desastres
Aún no hay calificaciones
Plan DN-III-E: Auxilio en Desastres
19 páginas
Man Intel-Naval
Aún no hay calificaciones
Man Intel-Naval
64 páginas
Informe Requisitos para Ser Piloto
Aún no hay calificaciones
Informe Requisitos para Ser Piloto
27 páginas
Introducción a la Investigación de Operaciones
100% (2)
Introducción a la Investigación de Operaciones
55 páginas
Etapas del Proceso de Toma de Decisiones
Aún no hay calificaciones
Etapas del Proceso de Toma de Decisiones
8 páginas
Toma de Decisiones
Aún no hay calificaciones
Toma de Decisiones
3 páginas
Teoría y Proceso de Toma de Decisiones
Aún no hay calificaciones
Teoría y Proceso de Toma de Decisiones
84 páginas
Teoría de Toma de Decisiones Gerenciales
Aún no hay calificaciones
Teoría de Toma de Decisiones Gerenciales
14 páginas
Toma de Decisiones Empresariales
100% (1)
Toma de Decisiones Empresariales
18 páginas
Toma de Decisiones Empresariales Efectivas
Aún no hay calificaciones
Toma de Decisiones Empresariales Efectivas
16 páginas
Ocho Pasos en la Toma de Decisiones
Aún no hay calificaciones
Ocho Pasos en la Toma de Decisiones
3 páginas
Centroides y Cargas en Estática
Aún no hay calificaciones
Centroides y Cargas en Estática
21 páginas
Definiciones y Medidas en Física
Aún no hay calificaciones
Definiciones y Medidas en Física
7 páginas
Curva S
100% (1)
Curva S
12 páginas
Subducción y fósiles de orbitolina
Aún no hay calificaciones
Subducción y fósiles de orbitolina
41 páginas
Estimulación Matricial de Pozos Petroleros
Aún no hay calificaciones
Estimulación Matricial de Pozos Petroleros
6 páginas
Robots en la Perforación Petrolera
Aún no hay calificaciones
Robots en la Perforación Petrolera
3 páginas
Tribología y Mantenimiento Industrial
Aún no hay calificaciones
Tribología y Mantenimiento Industrial
20 páginas
Estimulación de Pozos
Aún no hay calificaciones
Estimulación de Pozos
8 páginas
Derecho Minero en Venezuela
100% (1)
Derecho Minero en Venezuela
7 páginas
Tipos de Completaciones de Pozos Según Sus Categorías Básicas
100% (1)
Tipos de Completaciones de Pozos Según Sus Categorías Básicas
15 páginas
Creencias en Macro Religiones y Dios
100% (1)
Creencias en Macro Religiones y Dios
11 páginas
Iglesia Joven: Rebelión y Cambio
Aún no hay calificaciones
Iglesia Joven: Rebelión y Cambio
18 páginas
LEYENDAS1
Aún no hay calificaciones
LEYENDAS1
6 páginas
Administración en Agencias de Viajes
Aún no hay calificaciones
Administración en Agencias de Viajes
3 páginas
VALORES Ebook 6 Pasos
100% (1)
VALORES Ebook 6 Pasos
23 páginas
El Comando Tribulación: Resistencia y Fe
Aún no hay calificaciones
El Comando Tribulación: Resistencia y Fe
28 páginas
Etnobotánica en Ocongate, Cusco
Aún no hay calificaciones
Etnobotánica en Ocongate, Cusco
168 páginas
Reforma Agraria en Bolivia: Historia y Impacto
Aún no hay calificaciones
Reforma Agraria en Bolivia: Historia y Impacto
2 páginas
Historia y Arquitectura del Imperio Persa
Aún no hay calificaciones
Historia y Arquitectura del Imperio Persa
40 páginas
Tabla Resumen General de Hormonas
Aún no hay calificaciones
Tabla Resumen General de Hormonas
2 páginas
Escuela Secundaria Técnica 93 "Profra. Elisa Garza Berlanga" Ciclo Escolar 2022-2023
Aún no hay calificaciones
Escuela Secundaria Técnica 93 "Profra. Elisa Garza Berlanga" Ciclo Escolar 2022-2023
6 páginas
Plancitos de Evaluacion Ingles I Lapso 2025-2026
Aún no hay calificaciones
Plancitos de Evaluacion Ingles I Lapso 2025-2026
3 páginas
Sandra León Grupo 403027 - 22
Aún no hay calificaciones
Sandra León Grupo 403027 - 22
13 páginas
Elementos y Teorías de la Comunicación
Aún no hay calificaciones
Elementos y Teorías de la Comunicación
35 páginas
Britney Spears The Woman in Me
57% (21)
Britney Spears The Woman in Me
182 páginas
Comunicación Oral y Escrita
Aún no hay calificaciones
Comunicación Oral y Escrita
3 páginas
Guía para Implementar NTCGP 1000:2004
Aún no hay calificaciones
Guía para Implementar NTCGP 1000:2004
69 páginas
Proceso y Democracia
Aún no hay calificaciones
Proceso y Democracia
34 páginas
Ébola
Aún no hay calificaciones
Ébola
3 páginas
Introducción al Género Lírico en Literatura
Aún no hay calificaciones
Introducción al Género Lírico en Literatura
11 páginas
Cambios y desafíos en la adolescencia
Aún no hay calificaciones
Cambios y desafíos en la adolescencia
3 páginas
Instituciones Educativas UGEL Maynas 2025
Aún no hay calificaciones
Instituciones Educativas UGEL Maynas 2025
54 páginas
Optimización en Modelos Lineales
Aún no hay calificaciones
Optimización en Modelos Lineales
1 página
Protocolo de Fuga Badajoz
Aún no hay calificaciones
Protocolo de Fuga Badajoz
18 páginas
Estrategias de Sun Tzu en Negocios
Aún no hay calificaciones
Estrategias de Sun Tzu en Negocios
13 páginas
Precauciones en La Administracion de Medicamentos
Aún no hay calificaciones
Precauciones en La Administracion de Medicamentos
4 páginas
Desafíos de Empresas Familiares en Bolivia
Aún no hay calificaciones
Desafíos de Empresas Familiares en Bolivia
6 páginas
Salud Mental y Abuso de Sustancias
Aún no hay calificaciones
Salud Mental y Abuso de Sustancias
2 páginas
Examen Final Curso TCC
Aún no hay calificaciones
Examen Final Curso TCC
2 páginas
Lectura y Escritura para Niños
100% (1)
Lectura y Escritura para Niños
84 páginas