0% encontró este documento útil (0 votos)
3 vistas88 páginas

WF DWH y DM

El documento aborda la evolución de los sistemas de Workflow y Data Warehouse, destacando la transición hacia computadoras móviles y el uso de cloud computing. Se enfatiza la importancia de la información generada por las organizaciones para la toma de decisiones y la mejora de la productividad a través de la implementación de tecnologías que facilitan la colaboración y la gestión de procesos. Además, se discuten las características y diferencias entre bases de datos operacionales y Data Warehouses, así como las estrategias para su diseño y gestión.

Cargado por

Feti FRBB
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
3 vistas88 páginas

WF DWH y DM

El documento aborda la evolución de los sistemas de Workflow y Data Warehouse, destacando la transición hacia computadoras móviles y el uso de cloud computing. Se enfatiza la importancia de la información generada por las organizaciones para la toma de decisiones y la mejora de la productividad a través de la implementación de tecnologías que facilitan la colaboración y la gestión de procesos. Además, se discuten las características y diferencias entre bases de datos operacionales y Data Warehouses, así como las estrategias para su diseño y gestión.

Cargado por

Feti FRBB
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

WorkFlow,

DataWareHouse y
DataMining
La construcción de un nuevo paradigma
- El reemplazo de computadoras de escritorio por computadoras móviles, lo que
ya se ha consolidado en el segmento de uso hogareño.
- El aumento de aplicaciones basadas en el uso de “cloud computing” como
almacenamiento y soporte de aplicaciones, que incluso llegan con viabilidad
económica al segmento Pymes.
- La importancia creciente de la información generada por las propias
organizaciones para la toma de decisiones estratégicas.
- Un cambio en la interface WYSWYG hacia otras formas dominantes en
dispositivos móviles (el cambio del escritorio de Windows 8 a una forma similar
a la presentada en dispositivos Android o Symbian), el uso de interface táctil, el
uso de la voz o la detención de gestos, por ejemplo.
- La vinculación entre la información producida por los procesos de una
organización y la gestión de la empresa, lo que ya fue incluido en la revisión
2008 de la norma ISO 9001.
- El desarrollo de nuevas metodologías de “búsqueda inteligente” de información
oculta en los datos almacenados de la historia de la organización.
La construcción de un nuevo paradigma
Workflow Clásico

Los sistemas Workflow permiten


soportar los clásicos circuitos de
expedientes directamente sobre una
red de ordenadores, recurriendo al
papel sólo ordenadores centrales, así
como el enlace con otras aplicaciones
ofimáticas. cuando es imprescindible.
Por medio de un “motor de workflow”
situado en el servidor de la red, se van
encaminando los expedientes de acuerdo
con las reglas establecidas, y facilitan las
tareas de los usuarios integrando en el
circuito formularios electrónicos y acceso
a bases de datos
Además, los buenos paquetes
de Workflow permiten la
programación de las reglas con
un mínimo de programación,
habitualmente con herramientas
gráficas.
En este contexto, los sistemas
workflow son una tecnología
que ayuda a conseguir las
metas de la empresa, que son la
coordinación, comunicación y
cooperación entre los miembros
de la organización
Nuevos Sistemas Workflow

Los Nuevos sistemas workflow


son una tecnología que ayuda a
conseguir las metas de la empresa:
coordinación, comunicación y
cooperación entre los miembros
de la organización.
El nuevo workflow
permite la administración
de tareas a través de los
procesos de negocios,
dando la correcta tarea a
la persona correcta, en el
momento mas apropiado.
En el nivel de la comunicación,
provee reuniones y trabajo
cooperativo sin limitación de tiempo y
espacio.
Los sistemas workflow facilitan trabajar
en pos de metas organizacionales
Conecta las unidades de la
organización posibilitando el
incrementando las interrelaciones y
contribuye a eliminar las islas dentro de
la organización.
Esta tecnología también permite
manejar el conocimiento y llevar a un
aprendizaje organizacional a través
de los procesos de recolección,
procesamiento y distribución de la
información, y la constitución de una
memoria organizacional.
Este se ha vuelto uno de los
facilitadores claves para la
reestructura de la empresa
como parte de la reingeniería
del proceso de negocio, la
mejora continua o los
programas de manejo de la
calidad total.
El software workflow provee
funciones para:
• asignar tareas a las personas
•recordar a las personas tareas de una
lista de trabajo
• permitir la colaboración entre personas
•recuperar información para completar
la tarea, ej.los datos de un cliente
•proveer una visión para supervisa
cada tarea y la performance del equipo
Groupware

Es un software para facilitar la


colaboración dentro y entre compañías.
Como ejemplo está el uso del correo
electrónico donde las personas
intercambian información de una forma no
estructurada, también hubo paquetes
groupware como Lotus Notes o Microsoft
Exchange,
Groupware provee funciones
para promover el trabajo en
equipo y mejorar la eficiencia a
través de:

•incremento de la
información compartida
•reducción de las
comunicaciones jerárquicas
• proveer coordinación
Las funciones groupware provistas son:
• correo electrónico
• discusiones grupales
• documentos compartidos
•software para encuentros electrónicos
como video conferencias
• soporte de decisiones grupales
•software para coordinación grupal para
manejo de tiempos y arreglo de horarios
Groupware y Workflow
Workflow es considerado como una
función o subconjunto del groupware,
ya que una función workflow
realizarse usando groupware.
Un sistema workflow es bastante
diferente en la forma que es
diseñado, construido y usado.
Se suele indicar que deben ser
tratados como productos distintos.
¿ cómo se relaciona
workflow con groupware ?

En cualquier aplicación groupware,


workflow puede a cooperar,
comunicarse, compartir información y
completar tareas. Por eso workflow a
veces, es considerado una
subcategoría de groupware o una
función disponible en un groupware.
Dentro de la evolución del Workflow es
posible identificar ciertos productos que
acompañan al Workflow.

• Procesamiento de imágenes:
• Administración de documentos:
•Integración de Correo Electrónico
y Directorios:
• Aplicaciones basadas en
transacciones:
• Procesamiento de Formularios:
Ventajas que brinda utilizar Workflow
• Incremento de la productividad.
• Enfoque hacia la agregación de valor
• Reducción del tiempo de respuesta.
• Monitoreo de estado.
• Asignación de tareas a la gente.
• Recursos disponibles.
• Generación de reportes.
• Consistencia y confiabilidad.
• Reducción del consumo de papel.
• Control de los Procesos (Process Management)
• Reducción de tiempos muertos.
• Documentación de procesos.
• Reducción de ciclos por ejecución en paralelo.
• Integración con otras aplicaciones de línea.
La implementación de una solución Workflow mejorará
la productividad de varias maneras:
1. Reduciendo tramites y el procesamiento en papel.
2.Enlazando formularios electrónicos con sus bases
de datos, reduciendo errores y haciendo más
expeditivo el registro de información.
3. Evitando que se pierda información valiosa generada
en los procesos de del negocio.
4. Enrutando procesos a los individuos y garantizando
que el input corresponda a las reglas de negocio.
5.Evitando que se pierdan documentos,
procesos y negocios, en procesos burocráticos.
6.Organizando las actividades de cada partícipe de
un proceso.
7. Generando reportes e informes automáticamente.
8. Garantizando que en cada proceso se complete la
información establecida.
Conceptos manejados para modelar workflow.
(definiciones de los distintos elementos).

• Tareas.
• Personas (Usuarios).
• Roles.
• Rutas.
• Reglas de Transición.
• Datos.
• Eventos.
• Plazos (Deadlines).
• Procesos.
• Políticas.
Alternativas de arquitectura
Componentes

•Software: proveen
soporte para el sistema de
Workflow
•Datos y definición de
procesos: usados por los
componentes de software.
• Aplicaciones externas.
Elementos

• Herramienta de Definición de
Procesos.
• Definición de Procesos.
• Workflow Enactment Service
• Worklist (lista de trabajo)
• Manejador de Worklist
Implementation del Workflow Enactment Software
Aplicación a clientes de Workflow
Interfases y componentes de la
arquitectura del Workflow
Motor de Workflow

Es el software que provee el control del


ambiente de ejecución de una instancia
de Workflow, provee facilidades para:
• Interpretación de la definición de
procesos.
•Control de las instancias de los
procesos: creación, activación,
terminación, etc.
• Navegación entre actividades.
• Soporte de interacción con el usuario.
• Pasaje de datos al usuario o a
Tipos de Workflow Enactment Services.
Workflow Enactment Services homogéneos
están constituidos por uno o más motores de
Workflow compatibles. Estos proveen un ambiente
de ejecución, con un conjunto de atributos en la
definición del proceso. La interacción entre estos
motores es especifica de los productos.

Workflow Enactment Services heterogéneos


están constituidos de uno o más servicios
homogéneos, los cuales siguen un estándar para la
interoperabilidad entre los mismos.
Para la interacción de diversos motores:
•Se debe tener un esquema de nominación común
a través de motores heterogéneos.
•Deben soportar procesos de definición común
para objetos y atributos, para que puedan acceder a
ellos.
•Se debe soportar la transferencia de los datos
relevantes del Workflow, a través de los motores.
•Se debe soportar la transferencia de procesos,
sub- procesos o actividades entre los distintos
motores de Workflow.
•Se debe soportar funciones de administración y
monitoreo comunes, dentro de un dominio de motores
de Workflow
El Workflow Enactment Service podría ser
considerado como una máquina de estados, donde los
procesos cambian de estados según eventos externos,
o decisiones de control especificas, tomadas
internamente por el motor de Workflow.
Los estados básicos son:

•Iniciado: Ha sido creada una instancia del


proceso, pero no ha comensado.
•Corriendo: Se comenzó la ejecución del proceso,
y cualquiera de sus actividades podría comenzar.
•Activo: Una o más actividades del
proceso comenzaron.
• Suspendido: Se suspende la ejecución del
proceso.
•Completado: El proceso culminó, se realizan las
acciones programadas (auditoria) y luego se elimina
la instancia del proceso.
•Terminado: No se pudo terminar normalmente
la ejecución del proceso.
Ignorando ciertas complejidades como por ejemplo
la atomicidad de las actividades, se puede hacer un
diagrama de estados básico para una instancia de
una actividad.
•Inactivo: La actividad dentro de la instancia
del proceso ha sido creada pero no ha sido
activada y no tiene ningún elemento (Workitem)
para procesar.
•Activo: Un Workitem ha sido creado y
asignado a la instancia para su procesamiento.
•Suspendido: Se suspende la ejecución de
la instancia de la actividad. A la misma no se
le asigna un Workitem hasta que no vuelve al
estado Inactivo.
•Completado: La ejecución de la instancia de
la actividad ha sido terminada normalmente.
División de los sistemas de información
Data Warehouse

(SIO) Sistemas de
Información Operacionales

(AOP) Aplicaciones
Operacionales Data Warehouse

(BDO) Bases de Datos


Operacionales
Base de Datos Operacional Data Warehouse

Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Detallada Detallada + más resumida

Cambia continuamente Estable


Características de un Data Warehouse

•Orientado al tema
•Integrado
•De tiempo variante
•No volátil
Diferencias entre una BDO y un
DW (Entidad Bancaria)
Integración de los datos de las DBO al ingresar a un DW
La variante tiempo en los modelos DBO y DW
Diferencias en la operación de una DBO t un DW
Actualización (insertar, borrar y En DW se cargan inicialmente
modificar) regular en el los datos y se acceden a los
ambiente operacional mismos sin actualizarlos
Estructura de los datos en un Data Warehouse
Ejemplo de la estructura de datos en un DW
La Metadata contiene:

•La estructura de los datos

•Los algoritmos usados para la


esquematización

•La trazabilidad desde el ambiente


operacional al DW
Arquitectura de un Data Warehouse
Componentes de la arquitectura del DW:

•Base de datos operacional / Nivel de base de datos externo


•Nivel de acceso a la información
•Nivel de acceso a los datos
•Nivel de directorio de datos (Metadata)
•Nivel de gestión de proceso
•Nivel de mensaje de la aplicación
•Nivel de data warehouse
•Nivel de organización de datos
Ejemplo de operaciones que se
efectúan dentro de un ambiente
DW
Ejemplo de inconsistencia, por codificación de
manera diferente en tres bases de datos diferentes
Al ingresar la información al DW va al nivel de
detalle actual. Se queda allí y se usa hasta que
ocurra uno de los tres eventos siguientes:
•Sea eliminado

•Sea resumido

•Sea archivado
Medios de almacenamiento en un
DW
Uso de Base de Datos
Operacionales Uso de Data Warehouse

Muchos usuarios concurrentes Pocos usuarios concurrentes

Consultas complejas,
Consultas predefinidas y frecuentemente no
actualizables anticipadas.
Cantidades pequeñas de datos Cantidades grandes de datos
detallados detallados
Requerimientos de respuesta Requerimientos de respuesta
inmediata no críticos
Frecuencia de Requerimientos de datos en un DW
Ejemplo de tiempo y esfuerzo
desperdiciado por un enfoque anticuado
Ejemplo de una
DBO
estructurado
para un centro
de producción
industrial.
Una DBO con datos permanentes comparte las mismas
consideraciones de un DW, excepto por:
•El medio donde se almacena la data debe ser tan seguro como
sea posible.

•Los datos deben permitir ser restaurados.

•Los datos necesitan un tratamiento especial en su indexación,


ya que de otra manera los datos pueden no ser accesibles
aunque se haya almacenado con mucha seguridad
Forma de planificar la instalación del un DW:

•Establecer una asociación de usuarios, gestión y grupos

•Seleccionar una aplicación piloto con una alta


probabilidad de éxito

•Construir prototipos rápida y frecuentemente

•Implementación incremental

•Reportar activamente y publicar los casos exitosos


Estrategias para desarrollar de un DW

Primera
Establecer un ambiente "data warehouse virtual“.
•Entrenar a los usuarios finales.
•Controlar el uso del DW y crear un DW físico basado en el uso

Segunda
Construir una copia de los datos operacionales desde un
sistema operacional único y dar al DW de una serie de
herramientas de acceso a la información.

Tercera
Seleccionar el número de usuarios basados en el valor de la
empresa y hacer un análisis de sus puntos, preguntas y necesidades
de acceso a datos.
Estrategias para el Diseño de un Data Warehouse
•Los usuarios de los DW usualmente no conocen mucho sobre sus
requerimientos y necesidades como los usuarios operacionales.
•El diseño de un DW involucra pensar en términos amplios y
con conceptos más difíciles de definir que en un SIO (un DW
está bastante cerca a Reingeniería de los Procesos del Negocio).
•La estrategia de diseño ideal para un DW es de afuera hacia
adentro (outside-in) en lugar de arriba hacia abajo (top-down).

TIP: los diseñadores de DW tienden a usar "trucos" para que los


usuarios "visualicen" sus requerimientos, para esto son muy útiles
los prototipos .
Estrategias para el Gestión de un Data Warehouse
•Un DW es una inversión buena sólo si los usuarios finales
realmente pueden conseguir información vital más rápida y
más barata de lo que obtienen con la tecnología actual.

•La administración debe reconocer que el mantenimiento de la


estructura del DW es tan crítica como cualquier otra aplicación
de misión crítica.

•La gestión debe comprender que si se embarcan en un DW, se


crearán nuevas demandas sobre sus sistemas operacionales:
1. Demandas para mejorar datos
2. Demandas para una data consistente
3. Demandas para diferentes tipos de datos, etc.
Consideraciones que ayudan al Desarrollo de un DW

•Se ha reconocido los beneficios del procesamiento analítico


en línea (OLAP), más allá de las áreas tradicionales de
marketing y finanzas.
•El crecimiento de la computación cliente/servidor, ha
creado servidores de hardware y software más poderosos y
sofisticados que nunca.
•Al mismo tiempo, los Sistemas de Gestión de Base de
Datos (DBMS) modernos, proporcionan mayor soporte para
las estructuras de datos complejas.
•La renovación de hardware y software surgen los DW
multiterabyte que ahora se ve en ambientes de
cliente/servidor.
Consideraciones Previas al Desarrollo de un DW
Hay un número de dimensiones diferentes que necesitan
ser consideradas:
•Alcance de un data warehouse

•Redundancia de datos

•Tipo de usuario final


Esquema bidimensional para analizar las
opciones básicas del DW
Hay tres niveles esenciales de redundancia de datos que
las empresas deberían considerar en sus DW:

•Data warehouses "virtual" o "Point to Point"

•Data warehouses "centrales"

•Data warehouses "distribuidos"


Tipos de Usuario Final

Se puede considerar tres grandes categorías:

•Ejecutivos y gerentes
•"Power users" o "Buzo de Información" (analistas
financieros y de negocios, ingenieros, etc.)
•Usuarios de soporte (oficina, administrativos,
etc.).
Para conseguir que una implementación
exitosa del DW, se necesita enfocarse en tres
elementos claves para la construcción:

•Arquitectura total del depósito

•Arquitecturas del servidor

•Sistemas de Gestión de Base de Datos


Diseño de la Arquitectura del Depósito

1.- Un plan para almacenar los datos desde fuentes


múltiples: internas y externas, para consolidar la
base de datos en un DW integrado.

2.- Una arquitectura global que distribuya


información por función

3.- Una arquitectura por niveles para almacenar


datos altamente resumidos sobre las estaciones de
trabajo de los usuarios, con resúmenes más
detallados, en un segundo servidor y la información
más detallada en un tercero.
Almacenamiento de datos desde fuentes múltiples
Distribución de información por función
Arquitectura por niveles para almacenar datos
altamente resumidos
Arquitectura del servidor

•Servidores de un solo procesador

•Multiprocesamiento simétrico

•Procesamiento en paralelo masivo

•Acceso de memoria no uniforme


Sistemas de Gestión de Bases de Datos
•Los DW (con los sistemas de soporte de decisión y
las aplicaciones cliente/servidor), fueron éxitos del
DBMS relacional (RDBMS).

•Los RDBMS super relacionales (SRDBMS), con soporte


de hardware de base de datos especializada, como la máquina
de base de datos Teradata de REDBRICK y otras con
diagramas de indexación especializados de SYBASE IQ.

•Las bases de datos multidimensionales (MDDB)


manipulan los objetos de datos multidimensionales (por
ejemplo, la rotación fácil de los datos para verlos entre
dimensiones diferentes, o las operaciones de drill down que
sucesivamente exponen los niveles de datos más detallados).
¿Cómo comparar DBMSES?
Características Super Multidimensional Multidimensional Objeto
Relacional
/ Función Relacional (Lógico) (Físico) Relacional

Estructuras
Normalizadas

Tipos de datos
abstractos

Paralelismo
Estructuras
Multidimensio
nales
Drill-Down
Rotación

Operaciones
dependientes
de datos
Matriz de Decisión para el Data Warehouse
Requerimientos Soporte de
Usuarios Arquitectura Servidor DBMS
comerciales Sistemas

Alcance: departamental

Usos: análisis de Pequeña - Local mínimo - Consolidado - Procesador único o


MDDB
datos ubicación única central promedio paquete SMP

Alcance: departamental
Grandes Analistas
en una sola
ubicación; Seccionado - detalle Grupos de SMP para
Usos: análisis Local mínimo - RDBMS para central
usuarios en central - resumen central; SP o SMP
más informático central promedio - MDDB para local
informáticos en local para local
dispersos

Alcance: empresa
Grande;
Usos: análisis Objeto-relacional-
geográficamente Central fuerte Centralizado Grupos de SMP
más informático soporte Web
disperso
Alcance: departamental
Usos: Pequeña - pocas RDBMS con soporte
Central fuerte Centralizado MPP
investigación ubicaciones paralelo
Consideraciones adicionales en la implantación de un DW

•Combinación de la Arquitectura con el


Sistema de Gestión de Bases de Datos

• Planes de Expansión

•Confiabilidad de los Datos


Ejemplo de los
Riesgos de tener
Datos “Sucios”
Minería de datos

La minería de datos usa principios estadísticos


contrastados para detectar patrones en los datos,
ayudándole a tomar decisiones inteligentes sobre
problemas complejos.
La aplicación de los algoritmos de minería de datos,
a los datos le permitirá predecir tendencias,
identificar patrones, crear reglas y recomendaciones,
analizar la secuencia de eventos en conjuntos de
datos complejos y obtener nuevos puntos de vista.
Características de la minería de datos


Varios orígenes de datos: .

Limpieza de los datos
integrados,
administración de datos y ETL.

Varios algoritmos personalizables.

Infraestructura de prueba del modelo.

Consultas y obtención de detalles

Herramientas de cliente:.

Compatibilidad con el lenguaje
de
scripting y API

Seguridad e implementación
Aplicación de la Minería de datos

Pronóstico: cálculo de las ventas y predicción de las cargas del
servidor o del tiempo de inactividad del servidor.

Riesgo y probabilidad: elección de los mejores clientes para la
distribución de correo directo, determinación del punto
de
equilibrio probable para los escenarios de riesgo, y asignación de
probabilidades a diagnósticos y otros resultados.

Recomendaciones: determinación de los productos que
se
pueden vender juntos y generación de recomendaciones.

Búsqueda de secuencias: análisis de los artículos que los
clientes han introducido en el carrito de la compra y predicción
de posibles eventos.

Agrupación: distribución de clientes o eventos en grupos de
Minería de datos
Minería de datos

El algoritmo toma distintas formas:


Un conjunto de clústeres que describe cómo se
relacionan los casos de un conjunto de datos.

Un árbol de decisión que predice un resultado y que
describe cómo afectan a este los distintos criterios.

Un modelo matemático que predice las ventas.

Un conjunto de reglas que describen cómo se
agrupan los productos en una transacción, y las
probabilidades de que dichos productos se
adquieran juntos.
Minería de datos
Desarrollo de algoritmos personalizados

1.- Elegir el algoritmo correcto


2.- Elegir un algoritmo por
tipo

Algoritmos de
clasificación

Algoritmos de regresión

Algoritmos de
segmentación

Algoritmos de
asociación,

Algoritmos de análisis de
secuencias 3.- Elegir un algoritmo por
Estructuras de Minería de datos
Minería de datos

Definición de una estructura de minería de datos



Definir un origen de datos.

Seleccionar las columnas de datos que se
van a
incluir en la estructura y definir una clave.

Definir una clave para la estructura, incluyendo la
clave de la tabla anidada, si procede.

Especificar si los datos de origen se deben separar
en un conjunto de entrenamiento y en un conjunto
de prueba. Este paso es opcional.

Procesar la estructura.
Modelos de minería de datos

Se crea mediante la aplicación de


un algoritmo a los datos, pero es
algo más que un algoritmo o un
contenedor de metadatos: es un
conjunto de datos, estadísticas y
patrones que se pueden aplicar a
los nuevos datos para generar
predicciones y deducir relaciones
Modelos de minería de datos

• Arquitectura del modelo de minería de datos


• Definir modelos de minería de datos
• Propiedades del modelo de minería de datos
• Columnas del modelo de minería de datos
• Procesar modelos de minería de datos
• Ver y consultar modelos de minería de datos

También podría gustarte