0% encontró este documento útil (0 votos)
30 vistas52 páginas

Análisis de Datos para Simulación

Este documento describe los conceptos clave relacionados con el análisis de datos de entrada y modelos estocásticos para simulación. Explica cómo los datos deben procesarse y analizarse antes de usarse para alimentar un modelo, e introduce distribuciones teóricas, cadenas de Markov, teoría de colas y modelos de Montecarlo.

Cargado por

Jorge Tejada
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
30 vistas52 páginas

Análisis de Datos para Simulación

Este documento describe los conceptos clave relacionados con el análisis de datos de entrada y modelos estocásticos para simulación. Explica cómo los datos deben procesarse y analizarse antes de usarse para alimentar un modelo, e introduce distribuciones teóricas, cadenas de Markov, teoría de colas y modelos de Montecarlo.

Cargado por

Jorge Tejada
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

UNIDAD II: ANÁLISIS DE ENTRADA

Prof. CAMILO URRA RUBIO


Descripción de la asignatura.

2.1 Uso de datos para alimentar un modelo de


simulación.

2.2 Revisión y uso de distribuciones teóricas.

2.3 Selección de familias, estimación de parámetros y


bondad de ajuste.
Para alimentar un modelo de simulación, es
necesario recopilar datos relevantes sobre el
sistema o proceso que se está modelando.
Estos datos pueden provenir de diversas
fuentes, como registros de producción
Encuestas a clientes
Mediciones de sensores
Resultados de experimentos
Los datos deben ser:
-completos
-precisos
-relevantes
-representativos del sistema o proceso que se
está modelando.
Una vez que se han recopilado los datos, el
siguiente paso es analizarlos y procesarlos
para prepararlos para su uso en el modelo de
simulación. Esto puede implicar la
eliminación de datos irrelevantes o
incompletos, la normalización de los datos
para que estén en la misma escala,
identificación de patrones y tendencias, etc.
Luego que los datos han sido procesados y
preparados, se pueden utilizar para
alimentar el modelo de simulación. Se
definen las entradas del modelo, como el
flujo de materiales o la demanda de los
clientes, y los parámetros del modelo,
como los tiempos de procesamiento o los
costos de producción.
Distribuciones teóricas

El concepto de distribución se refiere al


reparto de una población de datos
según sus características.
Distribuciones teóricas

Describen la probabilidad de que ocurra


un determinado valor de variable
aleatoria. Los valores que son más
abundantes tendrán mayor
probabilidad de aparecer al realizar una
experiencia aleatoria.
No siempre es fácil determinar qué
distribución teórica es la más adecuada
para modelar una variable aleatoria en
particular. Por lo tanto, es común revisar y
comparar diferentes distribuciones teóricas
y seleccionar la que mejor se ajuste a los
datos observados o a las características del
sistema que se está modelando.
Gráficos de densidad y distribución acumulada:

estos gráficos pueden utilizarse para visualizar


la forma de la distribución teórica y compararla
con los datos observados. Si la forma de la
distribución teórica se ajusta bien a los datos,
es posible que sea una buena opción para
modelar la variable aleatoria.
Gráficos de densidad y distribución acumulada:

es una función matemática que se emplea para


saber la probabilidad de que una variable
aleatoria tome valores más pequeños o iguales
que un número en concreto, sea cual sea su
distribución.
Medidas de distribución.

Las medidas de distribución o de formas


permiten comparar la representación gráfica
(histograma o gráfico de barras) de una
muestra de datos con la representación gráfica
de una distribución normal.
Coeficiente de asimetría de Fisher.

Esta medida permite identificar si los datos se


distribuyen de forma simétrica alrededor del
punto central (media aritmética). Una
distribución muestral es simétrica cuando los
tres valores (promedio, moda y mediana) de
las medidas de tendencia central son
aproximadamente iguales.
Medidas de distribución.
Medidas de distribución.
Medidas de distribución.
Medidas de distribución.
Coeficiente de curtosis.

Esta medida estadística muestra la


concentración de los datos alrededor de la
media. Esta medida determina el grado de
concentración que presentan los valores en la
región central de la distribución. Con el
coeficiente de Curtosis se puede identificar si
la forma de concentración de los valores existe
una gran concentración de valores:
Medidas de distribución.
Medidas de distribución.
Medidas de distribución.
Medidas de distribución.
Estadísticos de bondad de ajuste:

Estos estadísticos, como el chi-cuadrado o el


estadístico de Kolmogorov-Smirnov, se
utilizan para evaluar la calidad del ajuste
entre la distribución teórica y los datos
observados. Cuanto más pequeño sea el
valor del estadístico, mejor será el ajuste.
La elección de familias se refiere a la
selección de un conjunto de distribuciones
estadísticas que puedan ser utilizadas para
modelar los datos que se están simulando.
Esto puede variar según el problema y los
datos en cuestión, por lo que es
importante tener un conocimiento
profundo del campo de estudio para
determinar qué distribuciones podrían ser
adecuadas.
La estimación de parámetros se refiere a la
selección de valores numéricos para los
parámetros de las distribuciones
seleccionadas en la elección de familias. Estos
valores pueden ser obtenidos a través de una
variedad de métodos, como la maximización
de la verosimilitud o el uso de técnicas de
regresión, y pueden ser ajustados a medida
que se realizan más iteraciones de la
simulación.
La bondad de ajuste se refiere a la evaluación
de qué tan bien los modelos de simulación
seleccionados y los valores de los parámetros
estimados se ajustan a los datos reales. Esto
se puede hacer comparando los resultados
de la simulación con los datos reales, y
utilizando métricas estadísticas como el error
cuadrático medio o el coeficiente de
determinación para determinar qué tan bien
se ajusta el modelo.
UNIDAD III: MODELOS ESTOCÁSTICOS.
Descripción de la asignatura.

3.1 Cadenas de Markov.

3.2 Teoría de colas.

3.3 Modelos de Montecarlo.


Cadenas de markov

Son modelos matemáticos que se utilizan


para describir la evolución de sistemas
estocásticos en el tiempo.
En una cadena de Markov, se asume que la
probabilidad de que el sistema se encuentre
en un estado en particular en el tiempo "t+1"
depende únicamente del estado en el que se
encuentra en el tiempo "t", y no de su
historia anterior. En otras palabras, el futuro
del sistema solo depende del estado actual, y
no de cómo llegó allí.
Cada estado en una cadena de Markov tiene
una probabilidad de transición asociada, que
representa la probabilidad de que el sistema
pase de un estado a otro en el siguiente paso
de tiempo. Estas probabilidades se organizan
en una matriz llamada matriz de transición,
donde cada entrada representa la
probabilidad de transición de un estado a
otro.
La teoría de colas

es un conjunto de herramientas matemáticas que


se utilizan para analizar el comportamiento de
sistemas que tienen algún tipo de cola o fila de
espera. Estos sistemas pueden ser tan diversos
como un restaurante, un aeropuerto, un banco o
un centro de llamadas, y se caracterizan por tener
una serie de llegadas de clientes y una serie de
servidores que atienden a esos clientes.
La teoría de colas se utiliza para responder
preguntas como: ¿Cuánto tiempo deben
esperar los clientes antes de ser atendidos?
¿Cuánto tiempo tardará un cliente en ser
atendido? ¿Cuál es la tasa de llegada
promedio de los clientes al sistema? ¿Cuál
es la tasa de servicio promedio de los
servidores?
Existen diversas herramientas matemáticas
utilizadas en la teoría de colas, como las
distribuciones de probabilidad, las
ecuaciones de balance de flujo, las fórmulas
de Little, y los procesos de renovación. Estas
herramientas se combinan para modelar y
analizar sistemas de colas en tiempo real y
determinar cómo optimizar su rendimiento.
Fuente de entrada o población potencial: Una
característica de la fuente de entrada es su
tamaño. El tamaño es el número total de clientes
que pueden requerir servicio en determinado
momento. Puede suponerse que el tamaño es
infinito o finito.

Cliente: Es todo individuo de la población potencial


que solicita servicio como por ejemplo una lista de
trabajo esperando para imprimirse.
Cola:
Espacio donde los clientes esperan (es decir,
están haciendo cola) hasta que empiezan a
ser servidos. Se caracteriza por una
capacidad o tamaño máximo de la cola, que
se puede suponer finita o infinita. Si es finita,
es posible que se llene de clientes por lo que
nuevos clientes son rechazados.
Disciplina de la cola: mecanismo empleado
para seleccionar el siguiente miembro que
recibirá servicio, una vez que queda un
recurso disponible. Por ejemplo, puede ser:

-FIFO (first in first out) primero en entrar,


primero en salir, según la cual se atiende
primero al cliente que antes haya llegado.
-LIFO (last in first out) también conocida
como pila que consiste en atender primero al
cliente que ha llegado el último.

-RSS (random selection of service) que


selecciona los clientes de manera aleatoria,
de acuerdo a algún procedimiento de
prioridad o a algún otro orden.
-Processor Sharing (PS) sirve a los clientes
igualmente. La capacidad de la red se
comparte entre los clientes y todos
experimentan con eficacia el mismo
retraso.
El modelo de Monte Carlo

es una técnica estadística de simulación que


se utiliza para estimar la distribución de
probabilidad de un conjunto de resultados
posibles. Esta técnica se basa en la generación
de múltiples muestras aleatorias, donde cada
muestra representa un posible resultado del
sistema en cuestión.
se utiliza en situaciones en las que es difícil o
imposible obtener una solución analítica o cerrada
a un problema. En lugar de eso, se generan
numerosas muestras aleatorias del sistema,
utilizando valores aleatorios para las variables de
entrada que afectan al resultado. Estas muestras
se utilizan para calcular estadísticas importantes,
como la media, la varianza y la desviación
estándar de los resultados, y para estimar la
distribución de probabilidad de los resultados.
Las muestras aleatorias se generan utilizando
una función de densidad de probabilidad,
que describe la distribución de probabilidad
de cada variable de entrada. Las muestras se
generan de forma aleatoria y se utilizan para
evaluar el modelo matemático que describe
el sistema en cuestión.

También podría gustarte