0% encontró este documento útil (0 votos)
93 vistas11 páginas

Información General Del Proyecto:: Practica 2 Modelado de Datos, Evaluación Del Modelo, Implantación Del Modelo

programa de series de tiempo en python

Cargado por

sarahifegue
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
93 vistas11 páginas

Información General Del Proyecto:: Practica 2 Modelado de Datos, Evaluación Del Modelo, Implantación Del Modelo

programa de series de tiempo en python

Cargado por

sarahifegue
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Practica 2

Modelado de datos, evaluación del modelo, implantación


del modelo

Información general del proyecto:


Realizar un análisis predictivo para la base de datos AdventureWorks2019
se debe realizar un análisis de serie de tiempo y aplicar un algoritmo de
PRIORI y aplicar Random Forest.

Estándares:
 Seguir los pasos del modelado CRISP-DM
Objetivos:

Requisitos/tareas:
 Comprensión del negocio (Define el Objetivo del negocio)
 Comprensión de los datos (Explica cada paso de esta fase
y muestra capturas de pantallas)
 Preparación de los datos (explica cada paso de esta fase y
muestra capturas de pantalla)
 Modelado (explica en análisis de serie de tiempo)
 Evaluación del modelo (explica detalladamente como
realizarías la evaluación de tu modelado)
 Despliegue (Explica y muestra capturas de pantalla de tu
modelado realizado)
Desarrollo:
Series de tiempo (forscast de ventas)
Objetivo: Se realiza un forscat de ventas
Comprensión de los datos: se proporciona una base de
datos llamado AdventureWorks2019

Preparación de datos:

Se realizo la preparación de datos de la tabla de ventas


(SalesOrderHeader) se preparo por fecha mes y el total de
ventas usando el sig. código:
Y se obtuvo la sig tabla:

Después damos click en AdventureWorks2019 y


desplazamos la tabla sales.salesOrder Header
Desplazamos la tabla de sales al código y lo ejecutamos

Después seleccionamos ventas y fechas y al ejecutarlo


sale lo solicitado
Modelado:
Una vez terminado, abrimos visual studio

Después agregamos el código que se nos mostro en


pantalla
Una vez echo al ejecutarlo tendremos que instalar
algunas librerías que se nos solicitan con jupyter,python

Después cerramos la pagina y la volvemos a abrir

Se tendrá que ejecutar y mostrar los datos que se


solicitaron
Una vez ejecutando esto mostrara el resultado de los
demás códigos

Continuando con cada código se mostrara algunas


graficas de la base de datos
Despliegue (Explica y muestra capturas de pantalla de
tu modelado realizado)

MODELO ARMA
La gráfica de decomposición estacional sugiere que hay un aumento en las ventas
en ciertos períodos del año, lo que podría deberse a eventos estacionales o de
temporada, como vacaciones, promociones o tendencias de compras en el
mercado.
√日
ARIMA significa "Autoregressive Integrated Moving Average". Es un modelo
estadístico utilizado para analizar y predecir series de tiempo.
En un modelo ARIMA, se descompone una serie de tiempo en tres componentes
principales: la tendencia, la estacionalidad y la aleatoriedad. La tendencia se refiere
a la dirección general en la que se mueve la serie de tiempo, la estacionalidad se
refiere a los patrones repetitivos que ocurren a intervalos regulares y la aleatoriedad
se refiere a la variabilidad que no se puede explicar por la tendencia y la
estacionalidad.
El modelo ARIMA utiliza una combinación de valores pasados de la serie de tiempo
para predecir futuros valores. El modelo se puede ajustar a los datos de la serie de
tiempo y se puede usar para predecir valores futuros. La combinación de valores
pasados que se utiliza para predecir el valor futuro se denomina "orden" del modelo
ARIMA.
En resumen, un modelo ARIMA es un modelo estadístico que se utiliza para analizar
y predecir series de tiempo. Se basa en descomponer la
serie de tiempo en sus componentes principales y utiliza una combinación de
valorespasados para predecir valores futuros.
Al ejecutar todas las librerías se deberá mostrar una
palomita que se ejecuta con éxito
Evaluación del modelo (explica detalladamente como
realizarías la evaluación de tu modelado)

Un modelo ARIMA es útil para modelar y predecir una


amplia variedad de series temporales, como datos
financieros, datos climáticos, ventas de productos,
entre otros. Se utiliza ampliamente en campos como la
economía, la meteorología, la ingeniería y las ciencias
sociales para comprender el comportamiento de las
series temporales y hacer predicciones a futuro. Es una
herramienta poderosa para el análisis y la predicción de
datos que exhiben patrones temporales.
Para aplicar el modelo ARIMA en datos de prueba y
entrenamiento, generalmente se sigue un proceso que
implica los siguientes pasos:
División de los datos: Se dividen los datos en dos
conjuntos: datos de entrenamiento y datos de prueba.
Los datos de entrenamiento se utilizan para ajustar el
modelo, mientras que los datos de prueba se utilizan
para evaluar el rendimiento del modelo.
Identificación del modelo ARIMA: Se identifican los
parámetros del modelo ARIMA que mejor se ajustan a
los datos de entrenamiento. Esto puede hacerse
mediante técnicas de análisis exploratorio de datos,
como la inspección de autocorrelaciones y
autocorrelaciones parciales, y también mediante
métodos automatizados como la búsqueda de
cuadrículas o la optimización bayesiana.
Ajuste del modelo: Se ajusta el modelo ARIMA a los
datos de entrenamiento utilizando los parámetros
identificados en el paso anterior.
Validación del modelo: Se evalúa el rendimiento del
modelo ajustado utilizando los datos de prueba. Esto
puede implicar calcular métricas de rendimiento como el
error cuadrático medio (MSE), el error absoluto medio
(MAE) o la raíz del error cuadrático medio (RMSE).
Refinamiento del modelo: Si es necesario, se refinan los
parámetros del modelo o se exploran otras técnicas
para mejorar su rendimiento, como la inclusión de
regresores exógenos o el ajuste de modelos más
complejos.

Registra tus notas y tu investigación aquí:


Comprensión de los datos
Resume los pasos o el plan de tu proyecto:
Iniciamos con la preparación de los datos de venta
preparados cada uno por fecha, mes y su total de
ventas. Abrimos el código en SQL19 y al ejecutar el
código obtuvimos la tabla la cual abrimos en
AdventureWorks2019 y la desplazamos a
sales.salesOrder Header haciendo una ejecución al
programa, haciendo mostrar una tabla de ventas con
meses y fechas,después abriendo Visual Studio y
agregando el mismo código en visual y ejecutando lo
mostrando columnas y filas con un orden tomando 5
valores principales y 5 finales
foto

Resume lo que aprendiste:


A conectar una tabla de SQL con un archivo y una bases de datos y su
ejecución al igual que visual studio y abrir las librerías de cada uno de
Python e instalarlos, ejecutando Python jupyter y como ordenar los
valores de la tabla de SQL tanto como abrir graficas y ver su funcionalidad
en los programas, tando como hacer un reporte respecto como se pide el
orden y aprendiento mas de cada una de las indicaciones
Nota: para la entrega de la practica tienen hasta el día Jueves 9
de Mayo del 2024

También podría gustarte