Business Intelligence e Data Warehouse 2024
Business Intelligence e Data Warehouse 2024
Aula 00
CNU (Bloco 2 - Tecnologia, Dados e
Informação) Passo de Conhecimentos
Específicos - Eixo Temático 5 - Apoio à
Decisão e Inteligência Artificial - 2024
(Pós-Edital)
Autor:
07 de Fevereiro de 2024
https://t.me/kakashi_copiador
Aula 00
CONTEÚDO ...................................................................................................................................... 1
GLOSSÁRIO DE TERMOS....................................................................................................................... 3
Data Warehouse......................................................................................................................... 18
QUESTÕES ESTRATÉGICAS.............................................................................................................. 41
Perguntas.................................................................................................................................... 60
Gabaritos .................................................................................................................................... 74
CONTEÚDO
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
ANÁLISE ESTATÍSTICA
SQL 21.6 %
Oracle 6.3 %
Segurança 1.8 %
MS-Access 1.8 %
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Índices 0.9 %
PostgreSQL 0.9 %
MySQL 0.9 %
GLOSSÁRIO DE TERMOS
Faremos uma lista de termos que são relevantes ao entendimento do assunto desta aula. Caso
tenha alguma dúvida durante a leitura, esta seção pode lhe ajudar a esclarecer.
Business Intelligence: Campo de análise de dados que visa fornecer suporte de tomada de
decisão em negócios. Envolve a coleta, integração, análise e apresentação de dados de negócios.
Data Warehouse (DW): Sistema de armazenamento de dados projetado para análise e relatórios,
em vez de processamento de transações. Armazena dados históricos e consolidados.
OLAP (Online Analytical Processing): Categoria de software que permite aos usuários analisar
facilmente informações de várias dimensões do banco de dados.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Self-Service BI: Práticas e ferramentas de BI que permitem aos usuários finais acessar e trabalhar
com dados corporativos mesmo sem a ajuda do departamento de TI.
Curadoria de Dados: Processo de gestão de dados que inclui coleta, organização, administração,
proteção e manutenção de dados.
Orientação por Assunto: Uma característica de um DW, refere-se à organização dos dados em
torno de temas ou assuntos específicos para análise.
Não Volatilidade: Uma vez que os dados são inseridos em um DW, eles não são alterados. Isso
assegura a consistência dos relatórios ao longo do tempo.
Data Warehouse Empresarial: Um DW que serve toda a organização com uma estrutura de
dados integrada e consolidada.
Arquitetura de Data Marts Independentes: Arquitetura onde data marts são criados sem um
DW centralizado, cada um com seus próprios dados.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Arquitetura de DW Federado: Arquitetura onde múltiplos DWs ou data marts são coordenados
e parecem um único DW para os usuários.
Abordagem Top-Down: Abordagem de design que começa com uma visão abrangente e
detalhada e depois a desagrega em componentes menores.
Modelagem Dimensional: Método de design de banco de dados que visa melhorar a legibilidade
e o desempenho de bases de dados orientadas a consultas.
Dimensão: Categoria de informação usada para análise em um DW, como tempo, localização ou
produto.
Esquema em Estrela: Modelo de banco de dados onde uma tabela de fatos está no centro,
cercada por tabelas de dimensão.
Esquema Floco de Neve: Modelo de banco de dados onde tabelas de dimensão estão
normalizadas, resultando em uma estrutura que se parece com um floco de neve.
Esquema em Constelação: Modelo de banco de dados com várias tabelas de fatos que
compartilham tabelas de dimensão.
ROTEIRO DE REVISÃO
A ideia desta seção é apresentar um roteiro para que você realize uma revisão completa do
assunto e, ao mesmo tempo, destacar aspectos do conteúdo que merecem atenção.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Business Intelligence (BI) é um termo abrangente que se refere ao uso de dados, informações e
conhecimento no processo de tomada de decisões nas organizações. A BI compreende
estratégias e tecnologias usadas pelas empresas para a análise de dados de negócios,
proporcionando uma visão abrangente das operações comerciais.
Histórico e Evolução
A ideia de usar dados para tomar decisões de negócios existe há séculos, mas o conceito de
Business Intelligence, como o conhecemos hoje, começou a se formar na segunda metade do
século 20.
Anos 1960 e 1970: A origem da BI como uma disciplina formal pode ser rastreada até os anos
1960 e 1970, quando os primeiros sistemas de informação de gestão foram desenvolvidos. Esses
sistemas eram bastante rudimentares e estavam mais focados em processamento de transações
do que em análise de dados. Eles eram usados principalmente para tarefas como folha de
pagamento e contabilidade. Durante essa época, o conceito de armazenamento de dados
começou a se desenvolver, permitindo que as empresas armazenassem grandes quantidades de
dados para futuras análises.
Anos 1980: Durante os anos 1980, o termo "Business Intelligence" foi popularizado por Howard
Dresner, um analista do Gartner, para descrever o processo de usar dados para melhorar as
decisões de negócios. Os sistemas de informação executiva (EIS) tornaram-se populares durante
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
esta época, permitindo que os gerentes visualizassem os dados da empresa em um formato fácil
de entender.
Anos 1990: Na década de 1990, a BI começou a evoluir rapidamente graças ao advento dos Data
Warehouses e das ferramentas de extração, transformação e carga (ETL). Estas tecnologias
permitiram às empresas recolher, limpar e armazenar dados de múltiplas fontes em um único
local centralizado, facilitando a análise e a tomada de decisões. Foi também durante este período
que as ferramentas de BI começaram a se tornar mais user-friendly, com interfaces gráficas e
funcionalidades drag-and-drop.
Anos 2000 e além: Com a chegada do século XXI, a BI passou por uma série de inovações
significativas. O aumento da capacidade de armazenamento de dados e o avanço das tecnologias
de processamento de dados permitiram o surgimento do Big Data e da análise preditiva. Além
disso, o surgimento de soluções de BI baseadas em nuvem tornou estas ferramentas acessíveis a
um público muito mais amplo.
Hoje, a Business Intelligence está mais avançada e acessível do que nunca, permitindo que as
empresas de todos os tamanhos e setores utilizem os dados para informar a tomada de decisões
e impulsionar o sucesso dos negócios.
Sistemas de Business Intelligence (BI) são compostos por vários componentes, cada um
contribuindo para a eficácia geral do sistema em coletar, armazenar, analisar e apresentar dados.
Os componentes chave de um sistema de BI incluem:
Fontes de Dados: Essas são as várias fontes das quais os dados são coletados para análise. As
fontes de dados podem ser internas (por exemplo, bancos de dados da empresa, planilhas,
sistemas ERP, CRM) ou externas (por exemplo, mídias sociais, bases de dados públicas, feeds de
notícias).
ETL (Extract, Transform, Load): ETL é o processo de extrair dados de várias fontes, transformá-
los para um formato adequado para análise e, em seguida, carregá-los em um local centralizado,
como um Data Warehouse. A transformação pode incluir a limpeza de dados, a integração de
várias fontes de dados e a conversão de dados em um formato padronizado.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Data Warehouse: É o repositório central onde os dados transformados são armazenados para
análise. Ele organiza os dados em um formato que facilita a consulta e a análise. Data
Warehouses podem armazenar grandes volumes de dados históricos, facilitando a análise de
tendências ao longo do tempo.
Data Mart: Data Mart é um subconjunto do Data Warehouse que é geralmente orientado para
uma linha de negócios específica ou um departamento. Eles permitem que os usuários acessem
e analisem dados relevantes para suas necessidades específicas.
Ferramentas de Análise e Consulta: Estas são as ferramentas que os usuários finais usam para
interagir com os dados. Elas permitem que os usuários consultem o Data Warehouse para
recuperar os dados de que precisam e realizem análises usando várias técnicas (por exemplo,
análise de tendências, análise de segmento, análise preditiva).
Data Mining: Data Mining é o processo de descobrir padrões e correlações nos dados que podem
não ser imediatamente óbvios. Ele usa uma variedade de técnicas, incluindo estatísticas,
inteligência artificial e aprendizado de máquina.
OLAP (Online Analytical Processing): OLAP é uma abordagem para responder a consultas
multidimensionais de maneira rápida. Ele permite que os usuários visualizem os dados de várias
perspectivas.
Dashboards
Dashboards, no contexto de Data Warehousing (DW) e Business Intelligence (BI), são interfaces
visuais que apresentam métricas e indicadores de desempenho chave (KPIs) de maneira concisa
e fácil de entender. Eles são projetados para fornecer aos usuários uma visão rápida e atualizada
do desempenho dos negócios ou de um aspecto específico do negócio.
Os dashboards podem incluir uma variedade de elementos gráficos, incluindo gráficos de barras,
gráficos de linhas, gráficos de pizza, mapas de calor, tabelas, entre outros, para apresentar dados
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
de maneira visual. Esses elementos são normalmente interativos, permitindo aos usuários filtrar
dados, perfurar para obter mais detalhes ou explorar diferentes visões dos dados.
Eles são alimentados por dados que foram coletados, transformados e armazenados em um DW.
Isso permite que o dashboard atualize regularmente com dados novos e precisos.
Dashboards são ferramentas úteis para os tomadores de decisão, pois permitem monitorar o
desempenho dos negócios em tempo real, identificar tendências e padrões, detectar problemas
ou oportunidades e tomar decisões informadas com base em dados.
Por exemplo, um dashboard de vendas pode mostrar informações sobre vendas totais, vendas
por região, vendas por vendedor, vendas por categoria de produto e assim por diante. As
informações apresentadas no dashboard podem ser atualizadas em tempo real ou em intervalos
regulares, dependendo das necessidades do negócio e da arquitetura do DW.
A figura abaixo mostra um exemplo de Dashboard de dados sobre visitas em uma página web:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
OLTP:
• OLTP é a estratégia que gerencia e manipula dados de transações em tempo real (dia a dia). É
caracterizado por um grande número de transações curtas que inserem, modificam e
recuperam dados de várias linhas na base de dados. Um exemplo de sistema OLTP seria um
sistema de processamento de pedidos online, em que cada pedido seria uma transação.
• Sistemas OLTP são orientados para a velocidade e a confiabilidade, pois precisam processar
transações de maneira rápida e precisa. Eles também são projetados para evitar conflitos de
dados - por exemplo, dois pedidos simultâneos que tentam comprar o último item em estoque.
• No contexto de um Data Warehouse, os dados OLTP são tipicamente a fonte que será carregada
no warehouse para análise. Porém, os dados precisam passar por um processo ETL (Extração,
Transformação, Carga) para serem otimizados para análise.
OLAP:
• OLAP, por outro lado, é a estratégia usada para analisar dados em um ambiente de Business
Intelligence. Sistemas OLAP são projetados para lidar com consultas complexas e permitir uma
análise aprofundada dos dados.
• Em vez de processar transações, sistemas OLAP são usados para explorar tendências, realizar
análises comparativas e outras análises de alto nível que podem envolver grandes volumes de
dados. Por exemplo, um sistema OLAP pode ser usado para analisar as vendas de um produto
ao longo do tempo, comparando diferentes regiões ou segmentos de clientes.
• Os sistemas OLAP são projetados para um desempenho rápido de consulta e análise,
geralmente pré-agregando dados e usando técnicas como cubos multidimensionais e
indexação bitmap.
Sistemas OLAP e Data Warehouse têm alguns objetivos básicos que os diferem de sistemas
transacionais convencionais, quais sejam:
Um dos principais objetivos de um Data Warehouse (DW) é garantir que os dados estejam
facilmente acessíveis para os usuários finais. Isso é particularmente importante em grandes
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
organizações, onde os dados podem ser gerados por muitos departamentos diferentes e
armazenados em muitos sistemas diferentes. Um DW coleta esses dados e os armazena em um
local centralizado, permitindo que os usuários acessem os dados de maneira rápida e fácil,
independentemente de onde os dados foram originalmente gerados.
A consistência dos dados é crucial para garantir a credibilidade do DW. Isso significa que os dados
devem ser precisos, completos e confiáveis. Para garantir a consistência, os dados normalmente
passam por um processo de ETL (Extração, Transformação, Carga) antes de serem carregados no
DW. Durante esse processo, os dados são limpos, verificados para garantir a qualidade e
transformados em um formato consistente. Isso garante que, independentemente de onde os
dados vêm, eles são apresentados da mesma maneira no DW, tornando-os mais fáceis de usar e
entender.
Um DW deve ser capaz de armazenar dados históricos e fornecer uma visão temporal dos dados.
Isso permite que os usuários realizem análises de tendências ao longo do tempo, o que pode ser
essencial para entender padrões e prever o futuro. Para isso, o DW deve ser projetado com um
componente de tempo, de modo que cada peça de dado esteja associada a um ponto específico
no tempo. Isso pode ser conseguido através do uso de marcas de tempo ou versões de dados.
Self-Service BI
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Self-Service BI serve para democratizar o acesso aos dados e a análise de dados em uma
organização. Ele permite que os usuários de negócios – que são frequentemente os que mais
entendem suas próprias necessidades de dados – acessem e analisem dados de forma
independente, sem ter que passar por um intermediário. Isso torna o processo de análise de
dados mais rápido e mais ágil, pois os usuários não precisam esperar pela assistência de
especialistas em análise de dados.
Agilidade e Velocidade: Com o Self-Service BI, os usuários podem acessar e analisar dados em
tempo real, sem atrasos causados pela solicitação de relatórios ou análises a um departamento
de TI ou análise de dados.
Alívio para o Departamento de TI: Ao permitir que os usuários finais gerem seus próprios
relatórios e análises, o Self-Service BI pode aliviar a carga sobre os recursos de TI ou de análise
de dados, permitindo que se concentrem em outras tarefas importantes.
Melhoria na Tomada de Decisões: Com acesso direto aos dados, os tomadores de decisão
podem explorar os dados conforme necessário para apoiar suas decisões, levando a decisões de
negócios mais informadas.
Microsoft Power BI: Esta é uma suíte de ferramentas de análise de negócios que oferece recursos
de visualização de dados interativos, relatórios empresariais e dashboards.
Tableau: Tableau é outra poderosa ferramenta de BI que permite que os usuários criem
visualizações de dados interativas e dashboards. Ele tem uma interface de arrastar e soltar que
facilita a criação de visualizações.
QlikView: QlikView é uma plataforma de BI que permite aos usuários criar e implantar análises
interativas e dashboards. Ele usa uma interface de arrastar e soltar e permite aos usuários
explorar os dados de várias perspectivas.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
BI Tradicional Self-Service BI
Velocidade Pode ser lenta devido Rápida, pois os usuários podem gerar
ao envolvimento de TI relatórios e análises por conta própria
Governança de Dados
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
A Governança é responsável por definir quem dentro de uma organização tem autoridade e
controle sobre os dados e recursos de informação, e como esses dados são usados e protegidos.
Isso pode incluir questões como privacidade e proteção de dados, qualidade de dados,
conformidade com regulamentos e normas, e integração e compatibilidade de dados.
Por outro lado, a Gestão de Dados é a prática de planejar, controlar e entregar os dados e
recursos de informação de uma organização. Inclui uma série de atividades, como coleta de
dados, armazenamento de dados, processamento de dados, análise de dados, distribuição de
dados, etc.
Objetivos do DAMA-DMBOK2
• Criar consenso para uma visão geralmente aplicável das áreas de conhecimento de
gerenciamento de dados.
• Fornecer definições padrão para áreas de conhecimento de gerenciamento de dados
comumente usadas, entregáveis, funções e outras terminologias, em conjunto com o DAMA
Dictionary of Data Management e, assim, promover uma padronização de conceitos e atividades.
• Identificar princípios orientadores para o gerenciamento de dados.
• Esclarecer o escopo e os limites das atividades de gerenciamento de dados.
• Fornecer uma visão geral das boas práticas comumente aceitas, técnicas amplamente adotadas
e abordagens alternativas significativas, sem referência a fornecedores de tecnologia específicos
ou seus produtos.
• Apresentar questões organizacionais e culturais comuns.
• Identificar estratégias para análise de maturidade de gerenciamento de dados.
• Fornecer recursos adicionais e material de referência para melhor entendimento do
gerenciamento de dados
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Princípio Descrição
Regra de Ouro Este princípio estabelece que os dados são um ativo valioso e devem ser
tratados como tal. Isso significa proteger, manter e usar os dados de
maneira que maximizem seu valor para a organização.
Eficiência Este princípio foca na otimização do uso dos dados para alcançar os
objetivos da organização de forma mais eficaz e eficiente. Isso pode
envolver a eliminação de redundâncias, melhorando a precisão dos
dados, ou simplificando processos de gestão de dados.
Gestão de Risco Este princípio envolve a identificação e gestão de riscos associados aos
dados, incluindo problemas de segurança, privacidade e conformidade. O
objetivo é minimizar os potenciais danos que podem resultar do uso
inadequado dos dados.
Contextualização Este princípio implica que os dados devem ser usados e interpretados no
contexto adequado. Isso significa entender as circunstâncias que cercam
os dados, como eles foram coletados e para que propósito, para garantir
que eles sejam usados corretamente.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Inovação Este princípio reconhece que a governança de dados não deve restringir a
inovação, mas sim apoiá-la. Isso significa criar um ambiente que incentive
a exploração e o uso inovador dos dados, ao mesmo tempo em que se
gerencia riscos e se protege o valor dos dados.
Curadoria de Dados
Melhoria de Processos de Dados: O Data Steward pode trabalhar para melhorar os processos de
gestão de dados da organização, como processos de coleta de dados, processos de integração de
dados e processos de distribuição de dados.
Apoio à Tomada de Decisões Baseada em Dados: O Data Steward apoia a tomada de decisões
baseada em dados, fornecendo informações e insights a partir dos dados e ajudando a
interpretar e aplicar os dados de maneira eficaz.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Data Warehouse
Inicialmente, vamos ver a definição de Data Warehouse dos três principais autores sobre o
assunto:
Laudon&Laudon: Banco de dados, com ferramentas de consulta e relatório, que armazena dados
atuais e históricos extraídos de vários sistemas operacionais e consolidados para fins de análises
e relatórios administrativos.
Inmon: É uma coleção de dados orientados por assunto, integrados, variáveis com o tempo e não
voláteis, para dar suporte ao processo de tomada de decisão.
Características
Um Data Warehouse (DW) reúne dados de várias fontes dentro de uma organização para
fornecer uma visão consolidada e unificada da informação e são caracterizados pelos seguintes
atributos-chave:
Integração: DW integra dados de várias fontes e sistemas diferentes, proporcionando uma visão
unificada e consistente dos dados. Os dados de diferentes fontes são limpos, transformados e
integrados para garantir que sejam compatíveis e consistentes entre si.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Não Volatilidade: Uma vez que os dados são inseridos em um Data Warehouse, eles não são
modificados ou excluídos. Isso garante que os dados permaneçam consistentes e confiáveis para
análise ao longo do tempo.
Credibilidade dos Dados: Os Data Warehouses garantem a credibilidade dos dados através de
processos rigorosos de qualidade e governança de dados. Isso garante que os dados sejam
precisos, completos, atualizados e confiáveis.
A indústria atualmente reconhece pelo menos três tipos diferentes de Data Warehouses: Data
Mart (DM), Data Warehouse Empresarial (EDW) e Armazenamento de Dados Operacionais (ODS).
Data Mart:
Data Marts são utilizados para atender às necessidades de uma equipe ou grupo específico
dentro de uma organização. Eles permitem que os usuários acessem e analisem dados relevantes
para sua área específica de negócios, sem ter que lidar com a complexidade e a vastidão de um
Data Warehouse completo.
Por exemplo, um Data Mart de vendas inclui dados sobre clientes, vendas, produtos e vendas
por região. Um Data Mart de marketing pode incluir dados sobre campanhas de marketing,
respostas do cliente, análises de mercado e análises de segmento de clientes.
Desempenho: Como os Data Marts contêm menos dados do que um Data Warehouse completo,
as consultas geralmente são mais rápidas.
Relevância: Os Data Marts fornecem dados que são relevantes para um grupo ou equipe
específica, facilitando a análise e a tomada de decisões.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Facilidade de Uso: Como os Data Marts são menores e mais focados, eles são geralmente mais
fáceis de usar do que um Data Warehouse completo.
Implantação Rápida: Data Marts geralmente podem ser criados e implantados mais rapidamente
do que um Data Warehouse completo.
É importante notar que a utilização de Data Marts deve ser feita de forma estratégica e
cuidadosa, para evitar a criação de "silos de dados" onde os dados são isolados em diferentes
partes da organização. Idealmente, Data Marts devem ser usados como complemento a um Data
Warehouse, permitindo análises específicas de departamentos sem comprometer uma visão
unificada e integrada dos dados em toda a organização.
O EDW tem um papel crucial no apoio à tomada de decisões estratégicas e operacionais em toda
a organização. Ele permite que os tomadores de decisão acessem facilmente os dados
necessários para análises de desempenho, identificação de tendências, elaboração de previsões
e planejamento estratégico.
Os EDWs também são a espinha dorsal da maioria das iniciativas de Business Intelligence (BI),
fornecendo os dados necessários para relatórios, painéis (dashboards), análises e mineração de
dados.
Por exemplo, imagine uma grande empresa de varejo. O EDW dessa empresa pode coletar dados
de uma variedade de fontes, incluindo sistemas de ponto de venda (POS), sistemas de gestão de
relacionamento com o cliente (CRM), sistemas de gerenciamento de estoque e sistemas de e-
commerce. Todas essas informações são integradas e armazenadas no EDW.
A alta administração pode então utilizar esses dados para vários propósitos, como:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
ODS é um repositório de dados operacionais atuais, mantido a curto prazo, que permite a
consolidação de dados de diversas fontes, facilitando o acesso, a análise e a elaboração de
relatórios para usuários de negócios.
Integrar Dados: O ODS consolida dados de vários sistemas operacionais e os torna acessíveis para
uso. Isso é útil em organizações onde diferentes sistemas gerenciam diferentes operações, como
vendas, inventário e contabilidade.
Suportar Decisões Operacionais: O ODS permite aos gerentes e outros tomadores de decisões
acessar informações atualizadas sobre operações em tempo real, ajudando-os a tomar decisões
mais informadas.
Apoiar Processos de Negócios: Muitos processos de negócios exigem acesso a vários sistemas
operacionais. Um ODS pode facilitar esses processos, fornecendo acesso centralizado a todos os
dados necessários.
Por exemplo, em uma empresa de telecomunicações, um ODS pode ser usado para combinar
informações de sistemas de faturamento, atendimento ao cliente e provisionamento de rede.
Isso permitiria que os gerentes acessassem informações atualizadas sobre a utilização da rede,
questões de atendimento ao cliente e dados de faturamento em um único lugar, facilitando a
tomada de decisões operacionais e estratégicas.
Vale ressaltar que um ODS é diferente de um Data Warehouse na medida em que é atualizado
em tempo real e contém apenas dados atuais e operacionais, enquanto um Data Warehouse
contém dados históricos e é atualizado em intervalos regulares. Além disso, um ODS é
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
normalmente otimizado para leitura e escrita rápidas, enquanto um Data Warehouse é otimizado
para leitura e análise de dados.
O ODS (Operational Data Store) e a Staging Area são ambos componentes comuns de um sistema
de Business Intelligence/Data Warehouse, mas têm objetivos e funções ligeiramente diferentes.
Operational Data Store (ODS): O ODS é um sistema intermediário entre os sistemas operacionais
(OLTP) e o Data Warehouse. É usado para realizar limpeza, integração e alinhamento de dados
de diferentes sistemas operacionais antes de serem carregados no Data Warehouse. O ODS é
projetado para executar operações de baixa latência, permitindo atualizações e consultas
rápidas, e costuma armazenar dados a um nível bastante detalhado.
Staging Area: A Staging Area, por outro lado, é o local onde os dados são preparados para o
carregamento no Data Warehouse. Os dados são extraídos dos sistemas de origem, podem ser
limpos e transformados para corresponder ao esquema do Data Warehouse e, em seguida, são
carregados no Data Warehouse. A Staging Area é temporária e não é projetada para consultas
ou atualizações frequentes.
A correlação entre ODS e Staging Area é que ambos são usados como áreas intermediárias para
a preparação e limpeza de dados antes do carregamento no Data Warehouse. Ambos são
fundamentais para garantir que os dados que chegam ao Data Warehouse sejam consistentes,
precisos e de alta qualidade.
Porém, eles não são idênticos. O ODS é um sistema que pode servir a várias finalidades
operacionais e analíticas, oferecendo um instantâneo atualizado em tempo real dos sistemas
operacionais. A Staging Area, por outro lado, é um componente de uma única direção do
processo de ETL, sem a intenção de ser usada para consultas diretas ou funções operacionais.
DW - Arquiteturas em Camadas
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
DW - Outras Arquiteturas
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
A arquitetura de Data Marts independentes é um modelo no qual vários Data Marts são criados
de maneira autônoma para atender a necessidades específicas de um departamento ou área de
negócios, sem a presença de um Data Warehouse centralizado.
Exemplo:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Exemplo:
Hub-and-spoke (Inmon):
• Hub Central (Núcleo): O hub, ou núcleo, é o repositório central de dados, geralmente um Data
Warehouse, onde os dados de diferentes fontes são integrados e consolidados. Este hub central
garante uma única versão da verdade e consistência nos dados.
• Spokes (Raios): Os "spokes" ou "raios" são os Data Marts, que são subconjuntos especializados
do Data Warehouse principal. Cada Data Mart é projetado para atender às necessidades de
uma área de negócios específica, como vendas, marketing ou finanças. Os dados são
alimentados a partir do hub central para os respectivos Data Marts.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
• Processo ETL: Os dados são extraídos das fontes operacionais, transformados e, em seguida,
carregados no hub central. De lá, os dados são novamente extraídos, possivelmente
transformados para atender a requisitos específicos do Data Mart e, em seguida, carregados
nos Data Marts.
• Consistência e Integração: Esta arquitetura permite a consistência dos dados (graças ao hub
central) enquanto ainda permite a personalização dos Data Marts para atender às necessidades
específicas de diferentes departamentos ou áreas de negócios.
Exemplo:
DW Centralizado:
A arquitetura de Data Warehouse (DW) centralizado é um modelo em que todos os dados de uma
organização são coletados e integrados em um único local central. Essa abordagem simplifica a
gestão de dados e fornece uma visão consistente e unificada dos dados em toda a organização.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
No entanto, uma desvantagem potencial de um DW centralizado é que ele pode ser mais difícil de
escalar à medida que a quantidade de dados aumenta. Além disso, pode não oferecer a mesma
flexibilidade que as arquiteturas baseadas em Data Marts para atender às necessidades específicas
de diferentes departamentos ou grupos de usuários.
Exemplo:
DW Federado:
A arquitetura de Data Warehouse (DW) federado é um modelo que combina vários Data
Warehouses ou Data Marts, cada um possuindo seu próprio banco de dados e regras de negócio,
em uma estrutura unificada para proporcionar uma visão integrada dos dados.
• Diversos Data Warehouses ou Data Marts: Em uma arquitetura federada, existem vários Data
Warehouses ou Data Marts que são desenvolvidos e gerenciados de forma independente, mas
conectados através de uma camada de integração.
• Camada de Integração: A camada de integração é responsável por unificar os diferentes Data
Warehouses ou Data Marts, facilitando consultas e análises que necessitam de dados de várias
fontes. Geralmente, isso é feito através de uma interface comum que traduz as consultas em
instruções apropriadas para cada sistema de banco de dados subjacente.
• Flexibilidade e Escalabilidade: A arquitetura federada permite que a organização integre dados
de várias fontes sem a necessidade de criar um único Data Warehouse centralizado. Isso
oferece maior flexibilidade e escalabilidade, pois novos Data Warehouses ou Data Marts podem
ser adicionados à federação conforme necessário.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
das consultas pode ser um desafio, especialmente quando os dados precisam ser coletados e
integrados de vários sistemas em tempo real.
Exemplo:
Considerados os dois principais autores de Data Warehouse, Bill Inmon e Ralph Kimball travam há
décadas uma batalha teórica no campo de BI, cada um com uma abordagem diferente.
A abordagem top-down para o design do Data Warehouse foi popularizada por Bill Inmon e
envolve a construção de um Data Warehouse empresarial centralizado antes de criar Data Marts
departamentais.
Características:
A abordagem bottom-up, por outro lado, foi popularizada por Ralph Kimball e envolve a
construção de Data Marts departamentais antes de integrá-los em um Data Warehouse
empresarial.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Características:
Comparação:
Embora ambas as abordagens tenham suas vantagens, elas também têm suas desvantagens. A
abordagem top-down, enquanto proporciona consistência, pode ser mais lenta e mais cara de
implementar, pois requer a construção de um Data Warehouse centralizado antes que os usuários
finais possam acessar os dados.
Por outro lado, a abordagem bottom-up pode entregar valor mais rapidamente, pois os Data Marts
departamentais são construídos primeiro. No entanto, esta abordagem pode levar a problemas de
consistência e integração de dados, especialmente se os diferentes Data Marts não forem
projetados com uma visão integrada em mente.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Fonte de Verdade O Data Warehouse centralizado Cada Data Mart pode atuar como
atua como a única fonte de verdade uma fonte de verdade para seu
respectivo departamento
Complexidade Pode ser mais complexo e Pode ser mais rápido para
demorado para implementar, implementar inicialmente, mas
devido à necessidade de construir o pode aumentar a complexidade a
Data Warehouse centralizado antes longo prazo devido à necessidade
dos Data Marts de integrar vários Data Marts
Custo Pode ser mais caro inicialmente, Pode ser menos caro
devido à necessidade de construir o inicialmente, mas os custos
Data Warehouse centralizado podem aumentar a longo prazo
devido à necessidade de integrar
vários Data Marts
Gestão de Dados É mais fácil garantir a consistência e Pode haver desafios para garantir
qualidade dos dados, pois há um a consistência e qualidade dos
único Data Warehouse centralizado dados, pois há vários Data Marts
independentes
Adaptabilidade às Pode ser menos flexível para Pode ser mais flexível para
Necessidades de atender às necessidades específicas atender às necessidades
Negócios de diferentes departamentos ou específicas de diferentes
usuários departamentos ou usuários
Modelagem Multidimensional
Em vez de organizar os dados em tabelas com linhas e colunas, como na modelagem relacional,
a modelagem multidimensional organiza os dados em uma estrutura cúbica, onde os dados são
acessados por várias dimensões.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Fatos: Os fatos representam dados quantitativos ou mensuráveis que uma empresa pode
querer analisar. Por exemplo, as vendas totais, o número de produtos vendidos ou a quantidade
de horas trabalhadas.
Dimensões: Dimensões são as várias perspectivas ou ângulos a partir dos quais uma
organização pode querer analisar os dados. Exemplos comuns de dimensões incluem tempo,
geografia, produtos e departamentos.
Dimensões
Uma dimensão, em essência, é um ângulo pelo qual os dados de negócios podem ser visualizados
ou analisados. Cada dimensão é geralmente composta de uma lista de valores discretos,
chamados de membros, e frequentemente tem uma estrutura hierárquica que permite a análise
em diferentes níveis de granularidade.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Dimensão de Tempo: Esta é talvez a dimensão mais comum. A dimensão de tempo pode incluir
elementos como dia, semana, mês, trimestre e ano, permitindo análises ao longo do tempo. Por
exemplo, um analista de negócios pode querer analisar as vendas trimestrais ou o crescimento
ano a ano.
Dimensão Geográfica: Esta dimensão permite a análise por localização. Pode incluir elementos
como país, estado, cidade, região, etc. Por exemplo, um gerente de vendas pode querer analisar
as vendas por região ou cidade.
Dimensão de Produto: Esta dimensão permite a análise por produto. Pode incluir elementos
como SKU do produto, nome do produto, categoria de produto, etc. Por exemplo, um gerente
de produto pode querer analisar as vendas por produto ou categoria de produto.
Dimensão de Cliente: Esta dimensão permite a análise por cliente. Pode incluir elementos como
ID do cliente, nome do cliente, segmento do cliente, etc. Por exemplo, um gerente de marketing
pode querer analisar o comportamento de compra por segmento de cliente.
Dimensão de Funcionários: Esta dimensão permite a análise por funcionário. Pode incluir
elementos como ID do funcionário, nome do funcionário, departamento, etc. Por exemplo, um
gerente de RH pode querer analisar a performance dos funcionários por departamento.
Essas dimensões ajudam a fornecer contexto aos fatos mensuráveis no DW, como vendas, custos
ou horas trabalhadas, permitindo que os usuários de negócios realizem análises complexas e
tomem decisões informadas.
Fatos
Os fatos são elementos centrais de um Data Warehouse (DW) que são quantificáveis e
mensuráveis, e que uma empresa pode querer analisar. Eles geralmente representam o
desempenho ou o comportamento dos negócios e são normalmente numéricos. Os fatos são
armazenados em tabelas de fatos que estão no centro de um esquema de estrela ou floco de
neve (descreveremos os esquemas mais à frente) na modelagem de dados multidimensional.
Fatos Aditivos: São os mais comuns e podem ser somados em qualquer dimensão. Por exemplo,
a quantidade total de vendas, a quantidade total de produtos vendidos, etc.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Fatos Semi-Aditivos: Podem ser somados em algumas dimensões, mas não em todas. Um
exemplo seria o saldo bancário - podemos somar saldos ao longo do tempo, mas não faria sentido
somar saldos entre contas.
Fatos Não Aditivos: Não podem ser somados de forma significativa em nenhuma dimensão. Por
exemplo, a temperatura média ou a porcentagem de lucro.
• Vendas Totais: Este é um fato aditivo que representa a quantidade total de vendas feitas por
uma empresa. Pode ser analisado por várias dimensões, como tempo, geografia, produto, etc.
• Número de Produtos Vendidos: Este é outro fato aditivo que representa o número total de
produtos vendidos. Pode ser analisado por várias dimensões, como tempo, geografia, produto,
etc.
• Horas Trabalhadas: Este é um fato aditivo que representa o número total de horas trabalhadas
pelos funcionários. Pode ser analisado por várias dimensões, como tempo, departamento,
cargo, etc.
• Saldo Bancário: Este é um fato semi-aditivo que representa o saldo atual da conta bancária de
um cliente. Pode ser analisado por várias dimensões, como tempo, cliente, tipo de conta, etc.
• Porcentagem de Lucro: Este é um fato não aditivo que representa a margem de lucro de um
produto ou serviço. Pode ser analisado por várias dimensões, como tempo, produto, categoria
de produto, etc.
Fatos são o que os usuários finais estão mais interessados em analisar, pois representam o
desempenho real do negócio. Dimensões, por outro lado, fornecem o contexto para esses fatos,
permitindo que os usuários entendam por que o desempenho é o que é e como ele pode ser
melhorado.
Fato Transacional: É a forma mais comum de tabela de fatos e representa eventos individuais
que ocorrem na organização. Cada linha na tabela de fatos transacionais corresponde a um
evento ou transação específica.
Fato Agregada: Uma tabela de fatos agregados armazena resultados pré-calculados de medidas
agregadas, tais como somas e médias, a partir de uma tabela de fatos transacionais. Isso é feito
para melhorar a performance das consultas.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Fato Consolidada: A tabela de fatos consolidada é uma versão simplificada da tabela de fatos
que consolida dados de diferentes tabelas de fatos para facilitar a análise.
Fato de Snapshot Periódico: Esta tabela de fatos fornece uma imagem dos dados em intervalos
regulares, como semanal, mensal, trimestral, etc. Cada registro representa um resumo de um
período de tempo específico.
Fato de Snapshot Acumulado: Este tipo de tabela de fatos é útil para processos de negócios que
têm claramente um início, meio e fim, onde se quer analisar a duração do ciclo. Cada registro
rastreia o estado do evento em intervalos de tempo regulares entre o início e o fim.
Fato Sem Fato: Uma tabela de fatos sem fatos (ou tabela de fatos de eventos) é uma tabela de
fatos que não possui medidas numéricas. Ela é usada para registrar a ocorrência de eventos. Por
exemplo, em um sistema de atendimento ao cliente, cada chamada de um cliente pode ser
registrada sem qualquer medida quantitativa.
Conteúdo Contêm chaves primárias que se referem Contêm chaves primárias que são
a chaves estrangeiras nas tabelas de referenciadas por chaves
dimensões e dados quantitativos estrangeiras nas tabelas de fatos e
associados a essas chaves. atributos associados a essas chaves.
Utilização Usada para responder questões Usada para fornecer contexto para
quantitativas sobre o negócio, como as medidas, como "Quais produtos
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Esquemas Multidimensionais
Eles são chamados de "multidimensionais" porque permitem aos usuários visualizar e analisar
dados de múltiplas dimensões ao mesmo tempo. Relembrando, uma "dimensão" é qualquer
categoria que os usuários finais possam querer analisar. Por exemplo, uma loja de varejo pode
querer analisar as vendas pela dimensão de "produto", "localização da loja", "tempo" e "cliente".
Cada uma dessas dimensões fornece uma perspectiva única sobre os dados.
Esquema em Estrela:
Tabela de Fatos: Esta é a tabela central no esquema em estrela, que contém as medidas, métricas
ou fatos de um negócio. A tabela de fatos armazena dados quantitativos que podem ser
analisados e contém chaves estrangeiras para as tabelas de dimensão. Por exemplo, em um DW
de varejo, a tabela de fatos pode conter dados como número de unidades vendidas, total de
vendas, lucro, etc.
Tabelas de Dimensão: Estas são as tabelas que circundam a tabela de fatos e fornecem contexto
para os dados na tabela de fatos. Elas contêm detalhes descritivos ou atributos de várias
dimensões de um negócio. Cada registro na tabela de fatos geralmente tem uma
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Total
ID_Venda ID_Cliente ID_Produto ID_Tempo ID_Loja Unidades
de
(PK) (FK) (FK) (FK) (FK) Vendidas
Vendas
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Neste esquema, a tabela de fatos (Vendas) contém dados mensuráveis e chaves estrangeiras
para as tabelas de dimensão. As tabelas de dimensão fornecem o contexto para os dados na
tabela de fatos. Este arranjo facilita a análise dos dados de várias perspectivas, como analisar as
vendas por produto, por cliente, por localização da loja ou ao longo do tempo.
Floco de Neve:
O Esquema Floco de Neve (Snowflake Schema) é uma extensão do esquema em estrela onde as
tabelas de dimensão são normalizadas, ou seja, a redundância de dados é eliminada. Essa
normalização quebra a tabela de dimensão em várias tabelas relacionadas, formando uma
estrutura que se assemelha a um floco de neve.
Aqui está um exemplo de Esquema Floco de Neve (Snowflake Schema) para um DW de varejo:
Unidades Total de
ID_Venda ID_Cliente ID_Produto ID_Tempo ID_Loja
Vendidas Vendas
101 Cliente A 1 1
102 Cliente B 2 2
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
10 1 Grande
11 2 Pequena
1 São Paulo SP
2 Rio de Janeiro RJ
1 Categoria X
2 Categoria Y
1 Segmento X
2 Segmento Y
Constelação:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Vamos criar um exemplo com duas tabelas de fatos: Vendas e Devoluções, e compartilhando
dimensões comuns, como Produto, Tempo e Loja.
Unidades Total de
ID_Devolução ID_Produto ID_Tempo ID_Loja
Devolvidas Devoluções
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Neste esquema, a tabela de Vendas e a tabela de Devoluções são independentes uma da outra,
mas compartilham tabelas de dimensão comuns. Isso permite análises complexas e abrangentes.
Por exemplo, podemos comparar o total de vendas e devoluções por produto, por loja ou ao
longo do tempo.
A tabela a seguir resume as diferenças entre os esquemas Star Schema, Snowflake e Constelação:
Simplicidade Alta. Fácil de entender e Média. A normalização Baixa. Pode ser difícil
implementar. adiciona complexidade. de entender devido à
presença de várias
tabelas de fatos.
Performance Alta. Menor número de Média. Mais joins Média. Pode haver
joins. devido à normalização. mais joins
dependendo do
número de tabelas de
fatos.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
1. Selecionar o processo de negócio: Esta é a primeira e uma das mais importantes etapas do
processo de design dimensional. O primeiro passo é selecionar o processo de negócio que será
representado no modelo dimensional. Este processo de negócio pode ser algo como vendas,
compras, produção, etc. A seleção do processo de negócio determinará o escopo do modelo
dimensional e influenciará todas as decisões subsequentes.
2. Definir a granularidade: A granularidade se refere ao nível de detalhe dos dados que serão
armazenados na tabela de fatos. A granularidade pode ser alta (detalhada) ou baixa (resumida),
dependendo das necessidades de análise de dados. Por exemplo, no caso do processo de
vendas, a granularidade pode ser ao nível de cada transação individual (alta granularidade) ou
ao nível de vendas diárias por loja (baixa granularidade).
3. Identificar as dimensões: As dimensões são as categorias de análise que dão contexto aos fatos.
Elas são geralmente aspectos do negócio que são de interesse para a análise, como tempo,
localização, produto, cliente, etc. As dimensões são identificadas com base no processo de
negócio selecionado e nas perguntas de análise que se quer responder.
4. Identificar as medidas: As medidas são os dados quantitativos que são analisados no contexto
das dimensões. No caso do processo de vendas, as medidas poderiam ser a quantidade de
produtos vendidos, o valor total das vendas, o lucro, etc. As medidas são armazenadas na tabela
de fatos e geralmente são numéricas e aditivas.
Estas etapas do design dimensional são repetidas para cada processo de negócio que se deseja
representar no data warehouse ou data mart. O resultado é um conjunto de tabelas de fatos e
dimensões que representam os processos de negócio e suportam a análise de dados.
QUESTÕES ESTRATÉGICAS
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
A ideia, aqui, não é que você fixe o conteúdo por meio de uma bateria extensa de questões, mas
que você faça uma boa revisão global do assunto a partir de, relativamente, poucas questões.
Comentários:
Gabarito: E
2. (FGV / IBGE – 2017) Pedro foi contratado para desenvolver uma solução de integração
de dados a partir de diversas fontes heterogêneas com o objetivo de apoiar a análise
de informações. A solução deve ter as seguintes características: Não-volátil, Histórico,
Orientado a Assunto e Variante no Tempo. Para isso, Pedro deve desenvolver um:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Comentários:
Definição de Bill Inmon: Data Warehouse é uma coleção de dados orientados por
assunto, integrados, variáveis com o tempo e não-voláteis, para dar suporte ao
processo de tomada de decisão.
Gabarito: B
3. (FGV / AL-MA – 2013) Bill Inmom é considerado um dos “pais” da tecnologia de data
warehouse. O autor define o termo como sendo um conjunto de _____ integrado,
orientado _____, _____ no tempo e _____ que fornece suporte ao processo de tomada
de decisão”.
Comentários:
De acordo com Bill Inmon, um Data Warehouse é uma coleção de dados orientados
por assunto, integrados, variáveis com o tempo e não-voláteis, para dar suporte ao
processo de tomada de decisão.
Gabarito: A
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Comentários:
O que é uma consulta ad hoc? A expressão Ad hoc é uma expressão em latim que
significa “para este propósito“. Ou seja, a consulta é criada apenas para satisfazer
aquela necessidade específica, aquele propósito, em um momento específico. É
diferente das consultas de bancos de dados tradicionais, que geralmente são consultas
pré-determinadas e genéricas.
Gabarito: E
5. (FGV / MEC – 2009) Um termo está associado a uma coleção de dados orientada por
assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos
processos de tomada de decisão. É implementado por meio de um banco de dados
contendo dados extraídos do ambiente de produção da empresa, que foram
selecionados e depurados, tendo sido otimizados para processamento de consulta e
não para processamento de transações. Em geral, requer a consolidação de outros
recursos de dados além dos armazenados em base de dados relacionais, incluindo
informações provenientes de planilhas eletrônicas e documentos textuais. Seu
objetivo é fornecer uma "imagem única da realidade do negócio". De uma forma geral,
são sistemas que compreendem um conjunto de programas que extraem dados do
ambiente de dados operacionais da empresa, um banco de dados que os mantém, e
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
sistemas que fornecem estes dados aos seus usuários. O termo aqui tratado define o
conceito de:
a) DataMining
b) DataSystems
c) DataBusiness
d) DataProcessing
e) DataWarehouse
Comentários:
O termo associado a uma coleção de dados orientada por assuntos, integrada, variante
no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão é o
Data Warehouse.
Gabarito: E
III. Os Data Warehouses oferecem uma grande quantidade de dados integrados e são
livres das restrições do ambiente transacional, permitindo uma eficiência aumentada
no processamento da consulta.
A sequência correta é:
a) I - F; II - F; III - F.
b) I - V; II - F; III - V.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
c) I - V; II - V; III – F.
d) I - F; II - V; III - V.
e) I - V; II - V; III - V.
Comentários:
(I) Correto. Data Warehouses existem como armazenamento persistente (em que os
dados são preservados) em vez de serem materializados por demandas (como ocorrem
com as views); (II) Correto. Data Warehouses realmente podem ser indexados para
otimizar seu desempenho e melhorar a eficiência das consultas, suportando
funcionalidades específicas; (III) Correto. Uma das características do Data Warehouse
são os dados integrados, onde os dados não têm diversas limitações que existem no
ambiente transacional – isso, claro, permite o aumento de eficiência da consulta.
Gabarito: E
Comentários:
Sistemas interativos para inteligência de negócio são utilizados por gestores para
exploração de dados sumarizados para compreensão e inspiração na solução de
problemas. Nenhuma das outras opções faz qualquer sentido!
Gabarito: C
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
a) cubo OLAP.
b) dicionário de dados.
c) staging.
d) data vault.
e) data mart.
Comentários:
Gabarito: C
a) mesmo que data warehouse, já que ambos têm a finalidade de armazenar dados e
criar relatórios gerenciais.
Comentários:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
(a) Errado. DW é uma coleção de dados orientados por assunto, integrados, variáveis
com o tempo e não-voláteis – já o BI é um processo que auxilia na tomada de decisões;
(c) Errado. Não se trata de inteligência da empresa, mas de processos que ajudam na
tomada de decisões empresariais estratégicas;
(e) Errado. Esse item não faz o menor sentido. Na verdade, pode-se gerar relatórios
para os executivos de uma empresa, mas isso não é a definição de Business
Intelligence.
Gabarito: D
I. São integrados.
II. São orientados por assunto.
III. Contêm poucos níveis de detalhes.
IV. Contêm dados históricos de um período curto.
V. São dados capturados em um determinado momento.
a) I, II e III.
b) I, II e V.
c) I, III e V.
d) II, III e IV.
Comentários:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
De acordo com Bill Inmon, um Data Warehouse é uma coleção de dados orientados
por assunto, integrados, variáveis com o tempo e não-voláteis, para dar suporte ao
processo de tomada de decisão. Em geral, ele contém dados históricos de um período
longo – dados de um período curto geralmente estão em bancos de dados
transacionais. Por fim, os dados realmente são capturados em um determinado
momento pelo Processo ETL.
Gabarito: B
a) Codecs.
b) Dashboards.
c) Hardening.
d) Weblogs.
e) LMS (Learning Management Systems).
Comentários:
Gabarito: B
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
a) cubo OLAP.
b) dicionário de dados.
c) staging.
d) data vault.
e) data mart.
Comentários:
Gabarito: C
13. (VUNESP / MPE-SP - 2016) Observe o esquema a seguir, que representa a estrutura geral
e os componentes de uma solução de Business Intelligence – BI (Inteligência Empresarial
ou Inteligência de Negócios).
b) na camada ETL (do inglês Extract Transform Load – Extração, Transformação e Carga),
os dados extraídos dos aplicativos de gestão são inseridos diretamente no banco de
dados.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
c) no centro dessa arquitetura, está o data warehouse (banco de dados), que além de
conter dados granulares integrados, é considerado o “coração” de informações da
fábrica.
Comentários:
(c) Correto. Apesar de não saber o que o examinador quis dizer com “informações da
fábrica”, o DW realmente é o centro da arquitetura e contém dados granulares;
(e) Errado. Por conta do Processo de ETL, os componentes devem necessariamente ser
delineados de forma lógica para que os dados sejam armazenados de forma organizada
no DW
Gabarito: C
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
14. (VUNESP / PREF SÃO JOSÉ DOS CAMPOS - 2015) Na modelagem multidimensional, um de
seus componentes é a tabela fato, sobre a qual é correto afirmar que, em sua composição
típica:
a) contém um mínimo de 10% dos valores de seus atributos preenchidos com o valor nulo.
b) contém valores numéricos que representam o desempenho de um negócio.
c) não admite atributos do tipo literal ou numérico.
d) não contém chaves primárias nem chaves estrangeiras.
e) não pode conter mais de 10 atributos do tipo numérico.
Comentários:
Gabarito: B
15. (VUNESP / TCE SP - 2015) Uma das formas de modelagem utilizada no desenvolvimento
de data warehouses é a modelagem multidimensional. Nesse tipo de modelagem:
Comentários:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
As tabelas dimensão, por sua vez, contêm os atributos que descrevem as características
das dimensões, como o tempo, o produto, a localização, entre outros. Essas tabelas são
relacionadas à tabela fato por meio de chaves estrangeiras.
Gabarito: C
16. (VUNESP / TJ-PA – 2014) Um dos modelos mais utilizados na modelagem de data
warehouses é o modelo dimensional, sobre o qual é correto afirmar que:
Comentários:
As tabelas fato, por sua vez, armazenam as medições numéricas que representam o
desempenho do negócio. Essas medições estão relacionadas às dimensões por meio de
chaves estrangeiras.
Gabarito: C
a) backroom.
b) cesta de mercado.
c) granularidade.
d) parcelamento.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
e) snowflake.
Comentários:
Por exemplo, em uma tabela fato de vendas, a granularidade pode ser definida para
registrar as vendas em nível diário, semanal, mensal ou anual. Isso influencia a quantidade
de registros e o nível de detalhe dos dados armazenados.
Gabarito: C
E) a carga de dados do ambiente de produção para o data warehouse só pode ser feita uma
vez por semana.
Comentários:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
unidade, como converter centímetros (cm), milímetros (mm) e metros (m) para uma única
unidade, como centímetros.
Gabarito: B
19. (FCC / SANASA – 2019) Atenção: Para responder à questão, considere a imagem abaixo.
a) Catálogo de Metadados.
b) Schema.
c) Drill.
d) OLTP.
e) Data Mart.
Comentários:
Cada um dos cilindros pequenos são Data Marts e o cilindro grande é um Data Warehouse.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Gabarito: Letra E
20. (FCC / SEFAZ-BA – 2019) Nos sistemas transacionais, os dados sofrem diversas alterações
como inclusão, alteração e exclusão. Antes de serem carregados no ambiente de um Data
Warehouse, os dados são filtrados e limpos, de forma a gerarem informação útil. Após esta
etapa, esses dados:
a) ficam disponíveis para a mineração em tempo real, pois tais dados são constantemente
atualizados a partir da chave de tempo que indica o dia em que foram extraídos dos
sistemas transacionais.
b) podem sofrer operações de consulta, mas, devido a sua não volatilidade, não podem ser
alterados, não havendo necessidade de bloqueio por concorrência de usuários ao seu
acesso.
c) são reunidos a partir de diversas fontes de dados, o que facilita muito o trabalho do
analista, embora este tenha que lidar com a grande redundância das informações.
Comentários:
(a) Errado, os dados não são constantemente atualizados; (b) Correto; (c) Errado, a
redundância é tratada durante o processo de transformação; (d) Errado, eles ficam
ordenados pela data do conteúdo do dado em si e, não, pela data de extração; (e) Errado,
eles podem ser organizados por diversos tipos de assuntos diferentes de acordo com o
desejo do usuário.
Gabarito: Letra B
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Comentários:
Após a Extração, os dados ficam em uma Staging Area aguardando para serem
transformados e carregados em um Data Warehouse.
Gabarito: Letra E
22. (CESPE / CNMP - 2023) Em data warehouse, o conceito de granularidade refere-se ao nível
de detalhe ou resumo existente em uma unidade de dados, de forma que, quanto mais
detalhes, mais alto o nível de granularidade.
Comentários:
É o exato oposto! Quanto maior o nível de detalhe dos dados, menor será a granularidade,
e quanto menor o nível de detalhe, maior será a granularidade. Isso significa que, com uma
granularidade mais alta, os dados são mais detalhados e específicos, enquanto que com
uma granularidade mais baixa, os dados são agregados e resumidos.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Gabarito: Errado
23. (CESPE / CNMP - 2023) Fatos, dimensões e medidas são elementos essenciais de um data
warehouse.
Comentários:
Perfeito! Fatos representam os dados numéricos e quantificáveis que são o foco da análise
em um data Warehouse; Dimensões são as características ou contextos que fornecem uma
==63fc==
estrutura para analisar os fatos; e Medidas são os atributos numéricos associados aos
fatos. Elas representam os valores específicos que estão sendo analisados ou calculados.
Gabarito: Correto
24. (CESPE / DPDF – 2022) Um ambiente de data warehouse permite acessos simultâneos ao
mesmo registro, para consulta e(ou) atualização, sem a preocupação com bloqueios de
deadlock.
Comentários:
Deadlock é uma situação em que ocorre um impasse, e dois ou mais processos ficam
impedidos de continuar suas execuções. Essa situação não ocorre em data warehouses,
pois eles suportam o acesso simultâneo. Os dados vêm de um ambiente operacional e,
depois de carregados no DW, podem ser consultados sem necessidade de nenhum tipo de
bloqueio por concorrência de usuários no seu acesso.
Gabarito: Correto
25. (CESPE / Petrobrás - 2022) No processo de preparação de dados para BI, um dado com
incompletude é normalmente aquele cujo valor está fora do domínio do atributo.
Comentários:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Um dado que está fora do domínio do atributo (ou que é discrepante em relação aos outros
dados) trata-se de um dado inconsistente, e não de um dado incompleto. Um dado
incompleto é aquele em que faltam valores de atributos.
Gabarito: Errado
Comentários:
Gabarito: Errado
São questões um pouco mais desafiadoras, porque a redação de seu enunciado não ajuda na sua
resolução, como ocorre nas clássicas questões objetivas.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
O objetivo é que você realize uma auto explicação mental de alguns pontos do conteúdo, para
consolidar melhor o que aprendeu ;)
Além disso, as questões objetivas, em regra, abordam pontos isolados de um dado assunto. Assim,
ao resolver várias questões objetivas, o candidato acaba memorizando pontos isolados do
conteúdo, mas muitas vezes acaba não entendendo como esses pontos se conectam.
Assim, no questionário, buscaremos trazer também situações que ajudem você a conectar melhor
os diversos pontos do conteúdo, na medida do possível.
É importante frisar que não estamos adentrando em um nível de profundidade maior que o exigido
na sua prova, mas apenas permitindo que você compreenda melhor o assunto de modo a facilitar
a resolução de questões objetivas típicas de concursos, ok?
Perguntas
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Perguntas e Respostas
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
2. (FGV / IBGE – 2017) Pedro foi contratado para desenvolver uma solução de integração
de dados a partir de diversas fontes heterogêneas com o objetivo de apoiar a análise
de informações. A solução deve ter as seguintes características: Não-volátil, Histórico,
Orientado a Assunto e Variante no Tempo. Para isso, Pedro deve desenvolver um:
3. (FGV / AL-MA – 2013) Bill Inmom é considerado um dos “pais” da tecnologia de data
warehouse. O autor define o termo como sendo um conjunto de _____ integrado,
orientado _____, _____ no tempo e _____ que fornece suporte ao processo de tomada
de decisão”.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
5. (FGV / MEC – 2009) Um termo está associado a uma coleção de dados orientada por
assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos
processos de tomada de decisão. É implementado por meio de um banco de dados
contendo dados extraídos do ambiente de produção da empresa, que foram
selecionados e depurados, tendo sido otimizados para processamento de consulta e
não para processamento de transações. Em geral, requer a consolidação de outros
recursos de dados além dos armazenados em base de dados relacionais, incluindo
informações provenientes de planilhas eletrônicas e documentos textuais. Seu
objetivo é fornecer uma "imagem única da realidade do negócio". De uma forma geral,
são sistemas que compreendem um conjunto de programas que extraem dados do
ambiente de dados operacionais da empresa, um banco de dados que os mantém, e
sistemas que fornecem estes dados aos seus usuários. O termo aqui tratado define o
conceito de:
a) DataMining
b) DataSystems
c) DataBusiness
d) DataProcessing
e) DataWarehouse
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
III. Os Data Warehouses oferecem uma grande quantidade de dados integrados e são
livres das restrições do ambiente transacional, permitindo uma eficiência aumentada
no processamento da consulta.
A sequência correta é:
a) I - F; II - F; III - F.
b) I - V; II - F; III - V.
c) I - V; II - V; III – F.
d) I - F; II - V; III - V.
e) I - V; II - V; III - V.
a) cubo OLAP.
b) dicionário de dados.
c) staging.
d) data vault.
e) data mart.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
a) mesmo que data warehouse, já que ambos têm a finalidade de armazenar dados e
criar relatórios gerenciais.
I. São integrados.
II. São orientados por assunto.
III. Contêm poucos níveis de detalhes.
IV. Contêm dados históricos de um período curto.
V. São dados capturados em um determinado momento.
a) I, II e III.
b) I, II e V.
c) I, III e V.
d) II, III e IV.
a) Codecs.
b) Dashboards.
c) Hardening.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
d) Weblogs.
e) LMS (Learning Management Systems).
a) cubo OLAP.
b) dicionário de dados.
c) staging.
d) data vault.
e) data mart.
13. (VUNESP / MPE-SP - 2016) Observe o esquema a seguir, que representa a estrutura geral
e os componentes de uma solução de Business Intelligence – BI (Inteligência Empresarial
ou Inteligência de Negócios).
b) na camada ETL (do inglês Extract Transform Load – Extração, Transformação e Carga),
os dados extraídos dos aplicativos de gestão são inseridos diretamente no banco de
dados.
c) no centro dessa arquitetura, está o data warehouse (banco de dados), que além de
conter dados granulares integrados, é considerado o “coração” de informações da
fábrica.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
14. (VUNESP / PREF SÃO JOSÉ DOS CAMPOS - 2015) Na modelagem multidimensional, um de
seus componentes é a tabela fato, sobre a qual é correto afirmar que, em sua composição
típica:
a) contém um mínimo de 10% dos valores de seus atributos preenchidos com o valor nulo.
b) contém valores numéricos que representam o desempenho de um negócio.
c) não admite atributos do tipo literal ou numérico.
d) não contém chaves primárias nem chaves estrangeiras.
e) não pode conter mais de 10 atributos do tipo numérico.
15. (VUNESP / TCE SP - 2015) Uma das formas de modelagem utilizada no desenvolvimento
de data warehouses é a modelagem multidimensional. Nesse tipo de modelagem:
16. (VUNESP / TJ-PA – 2014) Um dos modelos mais utilizados na modelagem de data
warehouses é o modelo dimensional, sobre o qual é correto afirmar que:
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
a) backroom.
b) cesta de mercado.
c) granularidade.
d) parcelamento.
e) snowflake.
19. (FCC / SANASA – 2019) Atenção: Para responder à questão, considere a imagem abaixo.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
a) Catálogo de Metadados.
b) Schema.
c) Drill.
d) OLTP.
e) Data Mart.
20. (FCC / SEFAZ-BA – 2019) Nos sistemas transacionais, os dados sofrem diversas alterações
como inclusão, alteração e exclusão. Antes de serem carregados no ambiente de um Data
Warehouse, os dados são filtrados e limpos, de forma a gerarem informação útil. Após esta
etapa, esses dados:
a) ficam disponíveis para a mineração em tempo real, pois tais dados são constantemente
atualizados a partir da chave de tempo que indica o dia em que foram extraídos dos
sistemas transacionais.
b) podem sofrer operações de consulta, mas, devido a sua não volatilidade, não podem ser
alterados, não havendo necessidade de bloqueio por concorrência de usuários ao seu
acesso.
c) são reunidos a partir de diversas fontes de dados, o que facilita muito o trabalho do
analista, embora este tenha que lidar com a grande redundância das informações.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
22. (CESPE / CNMP - 2023) Em data warehouse, o conceito de granularidade refere-se ao nível
de detalhe ou resumo existente em uma unidade de dados, de forma que, quanto mais
detalhes, mais alto o nível de granularidade.
23. (CESPE / CNMP - 2023) Fatos, dimensões e medidas são elementos essenciais de um data
warehouse.
24. (CESPE / DPDF – 2022) Um ambiente de data warehouse permite acessos simultâneos ao
mesmo registro, para consulta e(ou) atualização, sem a preocupação com bloqueios de
deadlock.
25. (CESPE / Petrobrás - 2022) No processo de preparação de dados para BI, um dado com
incompletude é normalmente aquele cujo valor está fora do domínio do atributo.
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador
. Túlio Lages
Aula 00
Aula 00
Gabaritos
1. E
2. B
3. A
4. E
5. E
6. E
7. C
8. C
9. D
10. B
11. B
12. C
13. C
14. B
15. C
16. C
17. C
18. B
19. E
20. B
21. E
22. E
23. C
24. C
25. E
26. E
CNU (Bloco 2 - Tecnologia, Dados e Informação) Passo de Conhecimentos Específicos - Eixo Temático 5 - Apoio à Decisã
www.estrategiaconcursos.com.br
https://t.me/kakashi_copiador