0% encontró este documento útil (0 votos)
156 vistas61 páginas

Herramientas de Inteligencia de Negocios

Los sistemas de información para soporte a decisiones incluyen sistemas de procesamiento de transacciones, sistemas de información gerencial, sistemas de soporte a decisiones, sistemas de apoyo a decisiones de grupo y sistemas de información ejecutiva. Los sistemas de soporte a decisiones proporcionan información relevante para la toma de decisiones no estructuradas mediante el análisis de datos, la simulación y otras herramientas. Los sistemas de información ejecutiva ofrecen acceso sencillo a información

Cargado por

valerio25
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
156 vistas61 páginas

Herramientas de Inteligencia de Negocios

Los sistemas de información para soporte a decisiones incluyen sistemas de procesamiento de transacciones, sistemas de información gerencial, sistemas de soporte a decisiones, sistemas de apoyo a decisiones de grupo y sistemas de información ejecutiva. Los sistemas de soporte a decisiones proporcionan información relevante para la toma de decisiones no estructuradas mediante el análisis de datos, la simulación y otras herramientas. Los sistemas de información ejecutiva ofrecen acceso sencillo a información

Cargado por

valerio25
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIDAD V: HERRAMIENTAS DE INTELIGENCIA DE NEGOCIOS

1.- Sistemas de información para soporte a las decisiones.


Debido a la gran variedad de usos y funciones que puede tener un Sistema de
Información, la literatura permite clasificar dichos Sistemas segregados por su
función principal, cabe tener en cuenta que han sido diseñados para mejorar la
toma de decisiones:
• Sistema de Proceso de Transacciones (SPT) o TPS (Transaction
Processing Systems): Son utilizados para realizar transacciones de datos,
únicamente es utilizado para registrar información y tomar decisiones
estructuradas. Es utilizado por el nivel medio-base de la empresa, siendo
importante para la recopilación de datos o el análisis de causas.
• Sistemas de Información Gerencial (SIG) o MIS (Management
Information Systems): También llamados Sistemas de Información
Administrativa (AIS) , sistema complementario del anterior, convirtiendo los
datos recopilados por un SPT en informes entendibles para el usuario. Es
utilizado por todos los niveles de la empresa que deban tomar decisiones
(variando la importancia según el nivel). Este sistema está entre un DSS
tradicional y una aplicación CRM/ERP.
• Sistema para el Soporte a las Decisiones (SSD) o DSS (Decision
Support System) : Dichos sistemas están encargados de proporcionar al
usuario información orientada a la toma de decisiones no estructuradas. Son
usados a un nivel medio-alto, en aquellos niveles donde se deban tomar
decisiones.
• Sistemas de apoyo a decisiones de grupo (GDSS-Group Decision
Support Systems) es un sistema que apoya a grupos de personas que
tienen un objetivo en común, y que sirve como interfaz con un entorno
compartido. El GDSS se basa en que si se mejoran las comunicaciones se
pueden mejorar las decisiones.

• Sistema de Información o apoyo para Ejecutivos (EIS - Executive


Information System) o ESS: Dichos Sistemas son los más usado en
Business Intelligence, proporcionan información crítica en un formato de
indicadores fáciles de entender para el directivo, porque proveen a los que
toman decisiones no estructuradas, de un acceso sencillo a información
interna y externa de su compañía, y que es relevante para lograr el éxito. Tal y
como el nombre indica, serán utilizados a un alto nivel (dirección) y muchas
veces estarán relacionados con la gestión de la estrategia empresarial.

• Sistemas Expertos basados en inteligencia artificial (SSEE o SSE): Los


Sistemas Expertos también llamados sistemas basados en conocimiento,
funcionan como una extensión del anterior, capturando el conocimiento y
capacidad de razonamiento del ser humano experto y aplicándolo a la toma
de decisiones. Se utilizan a un nivel alto-medio de la empresa.
Tipos de Decisiones

1.- Estructuradas
• Cotidianas, rutinarias y repetitivas
• Procedimientos predefinidos
• Niveles bajos de la jerarquía.

2.- Semiestructurada
• Contiene elementos de ambos tipos
• Niveles medios de la jerarquía

3.- No estructuradas
• No rutinarias e importantes
• No existen procedimientos predefinidos
• Dependen del buen juicio, la evaluación y el entendimiento
• Niveles altos de la jerarquía.
1.1.- Los sistemas de información para soporte a decisiones DSS

Comúnmente con las siglas DSS (Decision Support System) son sistemas
de información informáticos, que procesan datos con el fin de proporcionar
información y soporte al usuario para la toma de decisiones oportunas.
Los DSS tienen como objetivo proporcionar la mayor cantidad de
información relevante en el menor tiempo posible, con el fin de permitirle al
usuario tomar decisiones adecuadas.
En la práctica los DSS realizan una función de apoyo, esto implica ayudar a
las personas que trabajan solas o en grupo a reunir inteligencia, generar
alternativas, la evaluación y comparación de las alternativas para guiar al
usuario hacia la toma de decisiones

Los sistemas de soporte a decisiones son generalmente de tipo:


• OLAP-OnLine Analytical Processing: Bases de datos analíticas,
proveniente del acrónimo del inglés de procesamiento analítico en línea;
o
• de Minería de Datos que consiste en extraer información importante de
manera implícita de los datos.
Se considera que el concepto de DSS se convirtió en un área de
investigación en la década de 1970, antes de ganar en intensidad
durante la década de 1980.

En la década de 1970 DSS fue descrito como un “Sistema basado en


computadora para ayudar a la toma de decisiones“ y a finales de 1970
el movimiento de DSS comenzó a concentrarse en un "Sistema
interactivo basado ​en computadoras, que ayudan a los tomadores de
decisiones a utilizar las bases de datos y modelos para resolver
problemas".

En la década de 1980 el DSS debe proporcionar los sistemas de "usar


la tecnología adecuada y disponible para mejorar la eficacia de las
actividades empresariales y profesionales", y a finales de 1980, el DSS
se enfrentó a un nuevo reto “el diseño de estaciones de trabajo
inteligentes”.
Las funciones principales de los DSS
Los DSS permiten analizar las variables de un negocio, lo cual ayuda el
proceso de toma de decisiones de los directivos, los DSS son herramientas
útiles en inteligencia empresarial. Dentro de las funciones que realiza un DSS
encontramos:
1. Extracción y manipulación de información de una manera flexible.
2. Da soporte en el proceso en la toma de decisiones no estructuradas.
3. Permite la definición de la información que necesita y su combinación a
criterio del usuario.
4. Incluye varias herramientas, como simulación, modelización, etc.
5. Permite la combinación de información de los sistemas de la empresa con
los de otra empresa externa.

Objetivos de los DSS


Los DSS tienen como objetivo principal ofrecer información para apoyar al
usuario a la toma de decisiones oportunas, esto se puede desglosar en tres
objetivos secundarios:
 Aumentar la efectividad en la toma de decisiones de la alta dirección.
 Apoyar la toma de decisiones de las Gerencias, pero no reemplazarlo.
 Mejorar la efectividad en la toma de decisiones de los directivos.
La arquitectura de un sistema de soporte a decisiones está compuesta
generalmente por tres componentes:
1. Una base de datos (Base de conocimiento)
2. Un modelo: El contexto de decisión y los criterios del usuario
3. Interfaz del usuario
Los usuarios ellos mismos son también componentes importantes de la
arquitectura .Estos elementos pueden variar dependiendo del criterio de
elaboración del sistema.
Que en definitiva es un DSS

• Para tipo de Decisiones no estructuradas y semiestructuradas


• Orientados a modelos, Ej. sistemas físicos modelados con
ecuaciones diferenciales
• Orientados a datos, Ej. minera de datos
• Datos provenientes de TPS y fuentes externas
Ejemplos

1.- DSS para decisiones de fijación de precios. Vendedores detallistas pierden


millones de dólares porque basan sus precios en suposiciones. Software de
optimización de precios.
2.- DSS para detección de productos no rentables. Los ingresos por ventas de
un producto no reflejan su rentabilidad.
3.- DSS para administración de las relaciones con el cliente (CRM).
Herramientas analíticas para fragmentar clientes en diminutos segmentos.
Posibilitan el marketing individualizado y el análisis predictivo.
4.- Visualización de datos y sistemas de información geográfica (GIS)
5.- Mapas digitalizados enriquecidos
6.- Capacidades de modelado y simulación
7.-Toma de decisiones que requieren conocimiento de la distribución
geográfica
8.- Departamento de Policía de Nueva York. Captar datos acerca de
incidentes delictivos e incumplimientos de la ley. Reducción de los índices
delictivos.
Las principales tareas que el sistema de soporte a decisiones
realiza son:

 Mejorar el ratio coste-eficiencia y productividad


 Optimizar la estrategias para la generación de negocio
 Monitorizar las tendencias y descubrir anomalías
 Pronosticar las oportunidades de negocio
 Generar tablas de datos
 Crear gráficas y análisis de datos que sean requeridos
Beneficios los DSS
1. Mejora la eficiencia personal
2. Acelera el proceso de la toma de decisiones
3. Incrementa el control organizacional
4. Fomenta la exploración y descubrimiento por parte del tomador de
decisiones
5. Acelera la resolución de problemas en una organización
6. Facilita la comunicación interpersonal
7. Promueve el aprendizaje o la formación
8. Genera nuevas pruebas en apoyo de una decisión
9. Crea una ventaja competitiva sobre la competencia
10. Revela nuevos enfoques para pensar en los aspectos de un problema
11. Ayuda a automatizar los procesos de gestión
12. Reducción de costos en labores que requieran decisiones
Desventajas de los DSS
1. Se debe de instruir al personal para el buen manejo del sistema
2. Al momento de implantarlo, algunos miembros de la organización pueden
oponerse a su uso dado que no lo conocen. Se conoce como "Resistencia
al cambio"
3. Desconfianza en los resultados que arroja el sistema por parte de
miembros de la organización
4. La cultura organizacional debe estar abierta a nuevas propuestas para el
desarrollo de la compañía, si no es así, al momento de utilizar un DSS
puede ser de manera obligada.
5. Demasiado énfasis en la toma de decisiones.
6. Asunción de relevancia, una vez que los usuarios se acostumbran,
empiezan a depender del sistema.
7. Reducción de autoridad, los DSS pueden ser percibidos como la
transferencia de autoridad de decisión a un software.
1.2.- SISTEMAS DE INFORMACIÓN EJECUTIVA (EIS)

Un sistema de información ejecutivo (EIS), también conocido como


sistema de apoyo ejecutivo (ESS), es un tipo de sistema de
información de gestión que facilita y apoya la información ejecutiva y
empresarial, apoyado en las necesidades de toma de
decisiones. Ofrece fácil acceso a la información interna y
externa relevante para los objetivos organizacionales. Se
considera generalmente una forma especializada de sistema
de apoyo a las decisiones (DSS).

Los EIS enfatizan pantallas gráficas e interfaces de usuario fáciles,


usables. Ofrecen fuertes capacidades de reporting y de desglose. En
general, los EIS son DSS en toda la empresa que ayudan a los
ejecutivos de alto nivel a analizar, comparar, y poner en relieve las
tendencias de las variables importantes para que puedan monitorear
el desempeño e identificar las oportunidades y problemas.
En los últimos años, el término EIS ha perdido popularidad en favor
de Inteligencia de Negocios , con las sub-áreas de la presentación de
informes, análisis y tableros de herramientas administrativas (dashboards).

Ventajas:
 Fácil para los ejecutivos de nivel superior, ofrecen una amplia usabilidad.
 Proporciona la entrega de información oportuna y resumida de
una empresa.
 La información que se proporciona es mejor entendida.
 La administración, con un EIS, puede tomar decisiones con prontitud.
 Mejora la información de seguimiento.
 Ofrece eficiencia a los tomadores de decisiones.

Desventajas:
 Dependen mucho del sistema, no son muy modulares.
 Funcionalidad limitada, por diseño.
 A veces, sobrecargan de información a los administradores.
 Pueden generar beneficios difíciles de cuantificar.
 Los altos costos de implementación.
 El sistema puede llegar a ser lento, grande y difícil de manejar.
 Puede conducir a los datos menos fiables y menos seguro.
Características de un EIS
Un buen sistema de información para ejecutivos presenta información en
forma de gráficos, columnas y textos.
La capacidad para hacer gráficos se necesita para facilitar en el análisis
rápido de las condiciones y tendencias corrientes; las tablas presentan mayor
detalle y permiten el análisis de variaciones; la información de textos añade
interpretaciones y detalles de los datos.
Las principales características de los sistemas de información para ejecutivos
(EIS) son las siguientes:

• Están diseñados para cubrir las necesidades específicas y particulares de


la alta administración de la empresa.

• Extraen, filtran, comprimen y dan seguimiento a información crítica del


negocio.

• Implica que los ejecutivos puedan interactuar en forma directa con el


sistema sin el apoyo o auxilio de intermediarios.
• Es un sistema desarrollado con altos estándares en sus interfases
hombre-maquina, caracterizado por gráficas de alta calidad,
información tabular y en forma de texto.

• Pueden acceder a información que se encuentra en línea,


extrayéndose en forma directa de las bases de datos de la
organización

• El sistema está soportado por elementos especializados de


hardware, tales como monitores o videos de alta resolución y
sensibles al tacto, mouse e impresoras con tecnología avanzada.
Factores de éxito en implantación de un EIS

Usualmente los sistemas que apoyan decisiones, son difíciles de justificar, un EIS es
comúnmente desarrollado con altas expectativas de éxito y las razones principales a
considerar para su éxito son:
1. Acceso. Es obvio que si un sistema se encuentra disponible, significa que los
usuarios tendrán acceso a él, de una manera no complicada y desde puntos claves.
Si esto no sucede, el sistema no servirá de nada.
2. Uso. Un indicador importante es su frecuencia de uso. Si un sistema no es usado, o
simplemente, los usuarios potenciales no lo emplean, esto se reflejará en el éxito del
sistema.
3. Satisfacción. Si el sistema no puede satisfacer a sus usuarios, éstos no usarán el
sistema.
4. Impacto Positivo. Un sistema es exitoso si tiene un impacto benéfico en los ejecutivos
y la organización, al ser los primeros, y tomar mejores decisiones.
5. Difusión. Otro punto que indica el éxito es la propagación del sistema. El número de
personas que usa el sistema aumenta después de que los usuarios iniciales lo han
probado.
6. Tecnología: En el pasado, la falta de aplicaciones adecuadas para apoyar el concepto
era otra de las grandes limitantes, pero actualmente las soluciones presentes en el
mercado tienen la capacidad de integrarse fácilmente con otras aplicaciones.
Que en definitiva es un EIS

1. Dirigido a Gerentes
2. Tipos de Decisiones no estructuradas y semiestructuradas
3. Datos internos (MIS y DSS) y externos (noticias, tendencias, economía,...)
4. Funciones:
* Monitorizar indicadores del rendimiento
* Seguimiento de la competencia
* Detección de problemas
* Identificación de oportunidades de negocio
* Predicción de tendencias
5. Flexible e intuitivo (soporte grafico)
6. Análisis drill-down (trazabilidad): nivel de detalle
7. Comparativas graficas: por tiempo, región, producto, precios,...
8. Capacidad de analizar, comparar y resaltar las tendencias
9. Facilidad para explorar el entorno: indicativos de oportunidades y
amenazas estratégicas
10. Estrategia de percepción y respuesta: anticipación
11. Aumentan el rendimiento administrativo: mayor rango de acción
12. Potencia la descentralización de las decisiones
Diferencias entre un sistema DSS y un EIS

DSS EIS
1.- Sistema utilizado por 1.- Sistema utilizado por
Profesionales. Ejecutivos.

2.- Requerido para las operaciones 2.- Requerido para planes


del día a día. y procedimientos
Estratégicos.

3.- Maneja información para 3.- Maneja información para


decisiones Estructuradas o decisiones principalmente
Semiestructurada. No Estructuradas.

4.- Consiste principalmente 4.- Consiste principalmente


en el manejo fuertemente en el manejo fuertemente
de información interna mas de información interna y
que externa. externa.
1.3.- Sistemas de información gerencial (MIS-Management
Information Systems).

También llamados Sistemas de Información Administrativa (AIS o SIG),


dan soporte a un espectro más amplio de tareas organizacionales,
encontrándose a medio camino entre un DSS tradicional y una
aplicación CRM/ERP (TPS).
Los sistemas de información gerencial son una colección de sistemas
de información que interactúan entre sí y que proporcionan información
tanto para las necesidades de las operaciones como de la
administración
En teoría, una computadora no es necesariamente un ingrediente de
un MIS pero en la práctica es poco probable que exista un MIS
complejo sin las capacidades de procesamiento de las computadoras.
Es un conjunto de información extensa y coordinada de subsistemas
racionalmente integrados que transforman los datos en información en
una variedad de formas para mejorar la productividad de acuerdo con
los estilos y características de los administradores.
Todas las funciones gerenciales; Planeación, Organización, Dirección y
Control son necesarias para un buen desempeño organizacional. Para apoyar
estas funciones, en especial la Planeación y el Control son necesarios los
Sistemas de Información Gerencial.
El valor de la información proporcionada por el sistema, debe cumplir con los
siguientes cuatro supuestos básicos:
Calidad: Para los gerentes es imprescindible que los hechos comunicados
sean un fiel reflejo de la realidad planteada.
Oportunidad: Para lograr un control eficaz, las medidas correctivas en caso
de ser necesarias, deben aplicarse a tiempo, antes de que se presente una
gran desviación respecto de los objetivos planificados con anterioridad.
Cantidad: Es probable que los gerentes casi nunca tomen decisiones
acertadas y oportunas si no disponen de información suficiente, pero tampoco
deben verse desbordados por información irrelevante e inútil, pues esta puede
llevar a una inacción o decisiones desacertadas.
Relevancia: La información que le es proporcionada a un gerente debe estar
relacionada con sus tareas y responsabilidades.
Factores que determinan el desempeño de un sistema MIS

Para obtener una visión general del sistema de información gerencial y su


desempeño, se recomienda analizar los pasos siguientes de manera de
visualizar cómo funciona y qué se requiere para mejorarlo.

1. Identificar a todos aquellos que están utilizando o deberían utilizar los


distintos tipos de información (profesionales, trabajadores de campo,
supervisores, administradores, etc.)

2.- Establecer los objetivos a largo y corto plazo de la organización,


departamento o punto de prestación de servicios.

3.- Identificar la información que se requiere para ayudar a las diferentes


personas a desempeñarse efectiva y eficientemente, y eliminar la información
que se recolecta pero que no se utiliza.

4.-Determinar cuáles de los formularios y procedimientos actuales para


recolectar, registrar, tabular, analizar y brindar la información, son sencillos, no
requieren demasiado tiempo y cubren las necesidades de los diferentes
trabajadores, y qué formularios y procedimientos necesitan mejorarse.
5.-Revisar todos los formularios y procedimientos existentes para
recolectar y registrar información que necesiten mejorarse o
preparar nuevos instrumentos si es necesario.

6.-Establecer o mejorar los sistemas manuales o computarizados


para tabular, analizar, y ofrecer la información para que sean más
útiles a los diferentes trabajadores

7.-Desarrollar procedimientos para confirmar la exactitud de los


datos.

8.-Capacitar y supervisar al personal en el uso de nuevos


formularios, registros, hojas de resumen y otros instrumentos para
recolectar, tabular, analizar, presentar y utilizar la información.

9.-Optimizar un sistema de información gerencial: qué preguntar,


qué observar, qué verificar
Diferencias de los Sistemas de soporte.
EIS DSS MIS

1.- Sistema utilizado por Sistema utilizado por Sistema utilizado por
Ejecutivos- Alta Profesionales, Staff, Profesionales
Gerencia-Directores Asesores -Gerentes Operativos, Gerencia
Media

2.- Requerido para Requerido para las Requerido para las


planes y operaciones del día a operaciones del día a
procedimientos día. día.
estratégicos
3.- Maneja información Maneja información Maneja información
para decisiones para decisiones periódica, de
principalmente no principalmente excepciones, de
estructuradas. estructuradas o demanda, de informes
semiestructuradas. para decisiones más
estructuradas que
semiestructuradas
4.- Consiste Consiste principalmente Consiste principalmente
principalmente en el en el manejo en el manejo
manejo fuertemente fuertemente de fuertemente de
de información información interna más información interna
interna y externa que externa producida por
extracción y
manipulación de datos
del negocio
5.- Decisiones de largo o Decisiones de mediano Decisiones de mediano
mediano plazo. plazo. plazo o del día a día.
1.4.- Sistema de Procesamiento de Transacciones (TPS
Transactions Processing System)

Es un tipo de sistema de información, que recolecta, almacena, modifica y


recupera toda la información generada por las transacciones producidas en
una organización. Su función principal es evitar-enmendar cualquier error
ocurrido durante la transacción.
Es un sistema de procesamiento de transacciones, el archivo principal está
compuesto de piezas separadas de información (nombre, dirección, número
del empleado, cliente etc.) denominadas elementos de datos. Los datos se
introducen al sistema y estos actualizan los elementos de datos. Los
elementos del archivo principal se combinan de diferentes maneras para
elaborar informes de interés para la administración.
La base de un programa transaccional está en que gestiona los datos de forma
que estos deben ser siempre consistentes, si durante el transcurso de una
transacción ocurriese algún error, el TPS debe poder deshacer las operaciones
realizadas hasta ese instante.
Un TPS consignará una transacción y actualizará de manera permanente los
registros de la base de datos sólo si cada paso de la transacción se procesa de
manera satisfactoria. Si falla un paso, la recuperación permite devolver los
registros a su estado original.
Muchas organizaciones basan su fiabilidad en los TPS; un fallo en un TPS
afectará negativamente a las operaciones o incluso parará totalmente el
negocio. Para que un TPS sea efectivo, su tasa de fallos debe ser muy baja. En
caso de fallo de un TPS, debe existir algún mecanismo que permita una
recuperación rápida y precisa del sistema.
En este tipo de sistemas resulta crítico que exista un rendimiento elevado con
tiempos de respuesta cortos.
Un TPS requiere que todas las transacciones sean procesadas exactamente de
la misma forma, independientemente del usuario, el cliente o la hora del día. Si
los TPS fuesen flexibles, habría entonces demasiadas posibilidades de ejecutar
operaciones no estándar.
El procesamiento en un TPS debe apoyar las operaciones de la organización .
En cuanto a la estructura del TPS desde el punto de vista informático o lógico
esta constituido de la siguiente manera:

1. Interfaz del usuario: Consiste en un interfaz gráfica que permita la


comunicación entre el usuario y la maquina, la misma debe ser capaz de
enviar y solicitar datos, ofrecer al usuario ventanas, menú y mensajes que
permitan llevar a cabo la transacción de manera efectiva.

2. Controlador de pedidos: Es la parte encargada de recibir los datos


suministrados por la interfaz de usuario y redirigirlos a las rutinas o programas
encargados de manejar la transacción.

3. Servidor de la transacción: Es el contenedor del sistema, es el que mantiene


y se encarga que el programa avance; este activa procesos que ejecutan las
partes del programa que llevan acabo el trabajo u operaciones solicitadas por
el usuario.

4. Base de Datos: Es la encargada de almacenar de manera estructurada los


datos pertinentes a la transacción. usualmente se usa para brindar seguridad y
efectividad en le manejo de la información.
2.- Almacenes de Datos

A partir del modelo conceptual, es


posible empezar a plantearse cómo
será la arquitectura funcional del
Data Warehouse (DWH). Para ello
es necesario contemplar la
existencia de una capa intermedia
entre los sistemas origen y el DWH.
Este estrato servirá de capa de
abstracción entre el mundo de los
procesos y el mundo analítico,
permitiendo optimizar la integración
con el modelo definitivo.
Llegados a este punto, se hace
necesario definir dos bases de
datos:
- ODS (Operational Data Store) y
- Data Warehouse (DWH)
2.1.- Staging Area (Área de ensayo)
Es un área temporal donde se recogen los datos que se necesitan de los
sistemas origen. Se recogen los datos estrictamente necesarios para las
cargas, y se aplica el mínimo de transformaciones a los mismos.
De esta manera se minimiza la afectación a los sistemas origen, la carga
es lo más rápida posible para minimizar la ventana horaria necesaria, y se
reduce también al mínimo la posibilidad de error. Una vez que los datos
están traspasados, el DWH se independiza de los sistemas origen hasta
la siguiente carga. Lo único que se suele añadir es algún campo que
almacene la fecha de la carga.
Obviamente estos datos no van a dar servicio a ninguna aplicación de
reporting, son datos temporales que una vez hayan cumplido su función
serán eliminados, de hecho en el esquema lógico de la arquitectura
muchas veces no aparece, ya que su función es meramente operativa.
Hay quien considera que la Staging Area abarca más de lo que he
comentado, o incluso que este área engloba todo el entorno donde se
realizan los procesos de ETL.
2.2.- Extracción, Transformación y Carga (ETL - Extract clean -
Transform - Load)

Carga de datos es un proceso importante en el almacén de datos. Se


compone de 50% a 75% del almacenamiento de
datos. Proceso ETL efectiva representa el principal éxito del proyecto de
almacén de datos.

Extracción: El proceso por el cual los datos se tiran o empujan desde los
sistemas fuente dispares.

Limpieza: Después que los datos se extrae de la fuente viene el siguiente


paso que es limpiar los datos incorrectos o depurarlos.

Transformación: Sobre la base de las reglas del negocio se transforman


los datos.

Carga: Insertar / mover los datos transformados en las tablas de


dimensiones y de hechos en un almacén de datos.
Fase de Extracción
Para llevar a cabo de manera correcta el proceso de extracción, primera fase del ETL, hay que
seguir los siguientes pasos:
 Extraer los datos desde los sistemas de origen.
 Analizar los datos extraídos obteniendo un chequeo.
 Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o
estructura que se esperaba. Si no fuese así, los datos deberían ser rechazados (limpieza).
 Convertir los datos a un formato preparado para iniciar el proceso de transformación

Además, uno de las prevenciones más importantes que se deben tener en cuenta durante el
proceso de extracción sería el exigir siempre que esta tarea cause un impacto mínimo en el sistema
de origen. Este requisito se basa en la práctica ya que, si los datos a extraer son muchos, el
sistema de origen se podría ralentizar e incluso colapsar, provocando que no pudiera volver a ser
utilizado con normalidad para su uso cotidiano.

Fase de Transformación
La fase de transformación aplica una serie de reglas de negocio o funciones, sobre los datos
extraídos para convertirlos en datos que serán cargados. Estas directrices pueden ser declarativas,
pueden basarse en excepciones o restricciones pero, para potenciar su eficacia, hay que
asegurarse de que sean:
 Declarativas (datos de hechos)
 Independientes.
 Claras.
 Inteligibles (comprensible)
 Con una finalidad útil para el negocio.
Proceso de Carga
En esta fase, los datos procedentes de la fase anterior (fase de transformación) son
cargados en el sistema de destino. Dependiendo de los requerimientos de la
organización, este proceso puede abarcar una amplia variedad de acciones
diferentes.
Existen dos formas básicas de desarrollar el proceso de carga:

● Acumulación simple: esta manera de cargar los datos consiste en realizar un


resumen de todas las transacciones comprendidas en el período de tiempo
seleccionado y transportar el resultado como una única transacción hacia el data
warehouse, almacenando un valor calculado que consistirá típicamente en un
sumatorio o un promedio de la magnitud considerada. Es la forma más sencilla y
común de llevar a cabo el proceso de carga.

● Rolling: este proceso sería el más recomendable en los casos en que se busque
mantener varios niveles de granularidad. Para ello se almacena información resumida
a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo
o diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud
almacenada (por ejemplo, totales diarios, totales semanales, totales mensuales, etc.).
2.3.- ODS (Operational Data Store)

Es la capa intermedia que servirá como almacenamiento entre los sistemas


fuente y el Data Warehouse. Su misión es ofrecer la posibilidad
de gestionar los datos con el formato y estructura de origen para facilitar la
integración y transformación hacia el modelo desnormalizado que poseen
los Datamarts y el Data Warehouse.

Hay que tener en cuenta que los sistemas fuente presentan toda la
información separada por tablas, mientras que en destino la información se
compila en una estructura común, que facilita en gran medida, no sólo las
búsquedas, sino también la comprensión de los datos que contienen.

Como su nombre indica, este área es la que va a dar soporte a los sistemas
operacionales. El modelo de datos del Almacén de Datos Operacional sigue
una estructura relacional y normalizada, para que cualquier herramienta de
reporting o sistema operacional pueda consultar sus datos.
Está dentro del Data Warehouse porque se aprovecha el esfuerzo de integración
que supone la creación del Almacén de Datos Corporativo para poder atender
también a necesidades operacionales, pero no es obligatorio, y ni siquiera es algo
específico del Business Intelligence, los ODS ya existían antes de que
empezáramos a hablar de BI y de DWH.

No almacena datos históricos, muestra la imagen del momento actual, aunque eso
no significa que no se puedan registrar los cambios.

Los datos del ODS se recogen de la Stage Area, y aquí sí que se realizan
transformaciones, limpieza de datos y controles de integridad referencial para que
los datos estén perfectamente integrados en el modelo relacional normalizado.
Hay que tener en cuenta que la actualización de los datos del ODS no va a ser
instantánea, los cambios en los datos de los sistemas origen no se verán reflejados
hasta que finalice la carga correspondiente. Es decir, que se irán actualizando los
datos cada cierto tiempo, cosa que hay que explicar a los usuarios, porque los
informes que se lancen contra el ODS casi nunca podrán estar tan 'al minuto' como
los que existan en el sistema origen. Lo que sí se puede hacer es definir una mayor
frecuencia de carga para el ODS que para el Almacén Corporativo. Si es necesario,
se puede refrescar el ODS cada 15 minutos, por ejemplo
2.4.- Almacén de Datos Corporativo o Data Warehouse

Un Data Warehouse proporciona una visión global, común e integrada de


los datos de la organización, independiente de cómo se vayan a utilizar
posteriormente por los consumidores o usuarios, con las propiedades
siguientes:
• estable,
• coherente,
• fiable y
• con información histórica.
Al abarcar un ámbito global de la organización y con un amplio alcance
histórico, el volumen de datos puede ser muy grande (centenas de
terabytes). Las bases de datos relacionales son el soporte técnico más
comúnmente usado para almacenar las estructuras de estos datos y sus
grandes volúmenes. Normalmente en el almacén de datos habrá que
guardar información histórica que cubra un amplio período de tiempo.
Pero hay ocasiones en las que no se necesita la historia de los datos, sino
sólo sus últimos valores, siendo además admisible generalmente un
pequeño desfase o retraso sobre los datos operacionales, en estos casos el
almacén se llama almacén operacional (ODS, Operational Data Store).
El Almacén de Datos Corporativo sí que contiene datos históricos, y está
orientado a la explotación analítica de la información que recoge. Las
herramientas DSS o de reporting analítico atacarán principalmente a los
Data marts, pero también se pueden realizar consultas directamente contra
el Almacén de Datos Corporativo, sobretodo cuando sea necesario mostrar
a la vez información que se encuentre en diferentes Datamarts.

En él se almacenan datos que pueden provenir tanto de la Staging Area


como del ODS. Si ya hemos realizado procesos de transformación e
integración en el ODS no los vamos a repetir para pasar los mismos datos
al Almacén Corporativo. Lo que no se pueda recoger desde el ODS sí que
habrá que ir a buscarlo a la Staging Area.

Data Warehouse propiamente dicho, cuya función es mucho más compleja


que la de un simple almacén de datos, como puede extraerse de la riqueza
de su estructura, que se compone de:
 Tablas maestras (denominadas en el mundo analítico "dimensiones
conformadas"): son los pilares del Data Warehouse. Hacen
posible establecer relaciones entre los distintos Datamarts en base a
las dimensiones comunes del negocio.
2.5.- Data Mart o Mercado de datos

Podemos entender un Data Mart como un subconjunto de los datos del


Data Warehouse con el objetivo de responder a un determinado análisis,
función o necesidad y con una población de usuarios específica. Al igual
que en un data warehouse, los datos están estructurados en modelos de
estrella o copo de nieve y un data mart puede ser dependiente o
independiente de un data warehouse. Por ejemplo, un posible usos sería
para el data mining.

¿Qué diferencia existe entonces entre un data mart y un data warehouse?


Su alcance. El data mart está pensado para cubrir las necesidades de un
grupo de trabajo o de un determinado departamento dentro de la
organización. Es el almacén natural para los datos departamentales. En
cambio, el ámbito del data warehouse es la organización en su conjunto. Es
el almacén natural para los datos corporativos comunes.

Hay dos tipos de mercados de datos dependientes o


independientes. Un data mart dependiente es aquel cuya fuente es un
almacén de datos. Un mercado de datos independiente es aquel cuya
fuente es las aplicaciones heredadas o entorno OLTP.
3.- Procesamiento analítico en línea.

3.1.- Bases de datos OLTP y OLAP

3.1.1.- OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de


transacciones. Una transacción genera un proceso (que debe ser validado o
confirmado, o invalidado-revertido), y que puede involucrar operaciones de
inserción, modificación y borrado de datos. El proceso transaccional es
típico de las bases de datos operacionales.
El acceso a los datos está optimizado para tareas frecuentes de lectura y
escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que
soportar las BD de bancos o hipermercados diariamente).
Los datos se estructuran según el nivel aplicación (programa de gestión a
medida, ERP o CRM implantado, sistema de información departamental).
Los formatos de los datos no son necesariamente uniformes en los
diferentes departamentos (módulos).
El historial de datos suele limitarse a los datos actuales o recientes.
3.1.2.- OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento


analítico. Este análisis suele implicar, generalmente, la lectura de
grandes cantidades de datos para llegar a extraer algún tipo de
información útil: tendencias de ventas, patrones de comportamiento de
los consumidores, elaboración de informes complejos… etc. Este
sistema es típico de los datamarts.
El acceso a los datos suele ser de sólo lectura. La acción más común
es la consulta, con muy pocas inserciones, actualizaciones o
eliminaciones.
Los datos se estructuran según las áreas de negocio, y los formatos de
los datos están integrados de manera uniforme en toda la
organización.
El historial de datos es a largo plazo, normalmente de dos a cinco
años.
Las bases de datos OLAP se suelen alimentar de información
procedente de los sistemas operacionales existentes, mediante un
proceso de extracción, transformación y carga (ETL).
Concepto OLAP : Cubos

1.- Bases de datos relacionales organizan datos en tablas planas de dos


dimensiones.
• Filas y columnas con intersecciones únicas entre datos.

2.- Las Base de Datos Multidimensionales dependen de estructuras llamadas


cubos.
• Un cubo es una colección de medidas y dimensiones.
• Pueden haber “n” dimensiones.
• Las medidas son evaluadas en la intersección de todas las “N” dimensiones.

3.-Los cubos pueden ser esparcidos o densos (pocas o muchas


intersecciones).

4.- Los cubos permiten la agregación a través de jerarquías dimensionales.

5.- Permite la navegación hacia arriba / abajo en forma rápida.


4.- Data Mining o Minería de datos

La minería de datos es el proceso de detectar la información procesable de


los conjuntos grandes de datos. Utiliza el análisis matemático para deducir
los patrones y tendencias que existen en los datos. Normalmente, estos
patrones no se pueden detectar mediante la exploración tradicional de los
datos porque las relaciones son demasiado complejas o porque hay
demasiado datos.
El proceso de creación de un modelo de minería de datos es un proceso
dinámico e iterativo (cíclico). Una vez que ha explorado los datos, puede
que descubra que resultan insuficientes para crear los modelos de minería
de datos adecuados y que, por tanto, debe buscar más datos. O bien,
puede generar varios modelos y descubrir entonces que no responden
adecuadamente al problema planteado cuando los definió y que, por lo
tanto, debe volver a definir el problema. Es posible que deba actualizar los
modelos una vez implementados debido a que haya más datos
disponibles. Puede que haya que repetir cada paso del proceso muchas
veces para crear un modelo adecuado.
Estos patrones y tendencias se pueden recopilar y definir como
un modelo de minería de datos. Los modelos de minería de datos se
pueden aplicar en escenarios como los siguientes:
 Pronóstico: cálculo de las ventas y predicción.
 Riesgo y probabilidad: elección de los mejores clientes para la
distribución de correo directo, determinación del punto de equilibrio
probable para los escenarios de riesgo, y asignación de
probabilidades a diagnósticos y otros resultados.
 Recomendaciones: determinación de los productos que se pueden
vender juntos y generación de recomendaciones.
 Búsqueda de secuencias: análisis de los artículos que los clientes
han introducido en el carrito de la compra y predicción de posibles
eventos.
 Agrupación: distribución de clientes o eventos en grupos de
elementos relacionados, y análisis y predicción de afinidades.
Paro ser efectivo en el Data Mining se debe considerar como primer paso, el
definir el problema:
• definir el ámbito del problema,
• definir las métricas por las que se evaluará el modelo y
• definir los objetivos concretos del proyecto de minería de datos.
Estas tareas se traducen en preguntas como las siguientes:
 ¿Qué está buscando? ¿Qué tipos de relaciones intenta buscar?
 ¿Refleja el problema que está intentando resolver a los directivos o
procesos de la empresa?
 ¿Desea realizar predicciones a partir del modelo de minería de datos o
solamente buscar asociaciones y patrones interesantes?
 ¿Qué resultado o atributo desea predecir?
 ¿Qué tipo de datos tiene y qué tipo de información hay en cada
columna? En caso de que haya varias tablas, ¿cómo se
relacionan? ¿Necesita limpiar, agregar o procesar los datos antes de
poder usarlos?
 ¿Cómo se distribuyen los datos? ¿Los datos son estacionales? ¿Los
datos representan con precisión los procesos de la empresa?
Para responder a estas preguntas, puede que deba dirigir un estudio
de disponibilidad de datos para investigar las necesidades de los
usuarios de la empresa con respecto a los datos disponibles. Si los
datos no abarcan las necesidades de los usuarios, podría tener que
volver a definir el proyecto.

También debe considerar las maneras en las que los resultados del
modelo se pueden incorporar en los indicadores de rendimiento clave
(KPI) que se utilizan para medir el progreso comercial.

El segundo paso del proceso de minería de datos es la preparación


de los datos, consiste en consolidar y limpiar los datos identificados, la
limpieza de datos no solamente implica quitar los datos no válidos o
interpolar valores que faltan, sino también buscar las correlaciones
ocultas en los datos, identificar los orígenes de datos que son más
precisos y determinar qué columnas son las más adecuadas para el
análisis.
El tercer paso del proceso de minería de datos, consiste en explorar los
datos preparados. Debe conocer los datos para tomar las decisiones
adecuadas al crear los modelos de minería de datos. Entre las técnicas de
exploración se incluyen calcular los valores mínimos y máximos, calcular la
media y las desviaciones estándar, y examinar la distribución de los datos,
al revisar el máximo, el mínimo y los valores de la media se podría
determinar que los datos no son representativos de los clientes o procesos
de negocio, y que por consiguiente debe obtener más datos equilibrados o
revisar las suposiciones que son la base de sus expectativas. Las
desviaciones estándar y otros valores de distribución pueden proporcionar
información útil sobre la estabilidad y exactitud de los resultados.

El cuarto paso del proceso de minería de datos, consiste en generar el


modelo o modelos de minería de datos. Usará los conocimientos adquiridos
en el paso Explorar los datos para definir y crear los modelos. Deberá
definir qué columnas de datos desea que se usen; para ello, creará una
estructura de minería de datos. La estructura de minería de datos se vincula
al origen de datos, pero en realidad no contiene ningún dato hasta que se
procesa
El quinto paso del proceso de minería de datos, consiste en explorar los
modelos de minería de datos que ha generado y comprobar su eficacia. Antes
de implementar un modelo en un entorno de producción, es aconsejable probar
si funciona correctamente. Además, al generar un modelo, normalmente se
crean varios con configuraciones diferentes y se prueban todos para ver cuál
ofrece los resultados mejores para su problema y sus datos.

El último paso del proceso de minería de datos, consiste en implementar los


modelos. Una vez que los modelos de minería de datos se encuentran en el
entorno de producción, puede llevar acabo diferentes tareas, dependiendo de
sus necesidades:
• Usar los modelos para crear predicciones que luego podrá usar para tomar
decisiones.
• Crear consultas de contenido para recuperar estadísticas, reglas o fórmulas.
• Incrustar la funcionalidad de minería de datos directamente en una
aplicación que permita utilizarse para crear, cambiar, procesar y eliminar
estructuras y modelos de minería de datos.
• Crear un informe que permita a los usuarios realizar consultas directamente
en un modelo de minería de datos existente.
• Actualizar los modelos después de la revisión y análisis.
5.- Software de inteligencia de negocio

El software BI se ha convertido en una herramienta fundamental entre


las empresas que quieren mejorar su competitividad como apoyo a la
toma de decisiones de una forma informada. Existen numerosas
herramientas con sus características concretas, La inteligencia
empresarial (BI) aprovecha el software y los servicios para transformar
los datos en inteligencia, que informa para la toma de decisiones
empresariales estratégicas y tácticas de una organización.

Las organizaciones hoy en día pueden elegir entre una sólida lista de
proveedores que ofrecen herramientas de BI. Gartner identifica a casi
dos docenas de proveedores de BI y analíticos en su informe
del Cuadrante Mágico de 2017, en el que se menciona a Microsoft Power
BI, Qlik Sense y Tableau Server como líderes. Otros proveedores de
herramientas de BI incluyen Information Builders, Sisense y Zoomdata.
Las organizaciones eligieron una plataforma de BI basada en varios
factores, incluyendo el tamaño y la complejidad de sus operaciones, así
como el tipo de tecnología que ya tienen IBM, Oracle, SAS Visual
Analytics y SAP Business Objects.
Valor

Capacidad

También podría gustarte