Serviço de Data Processing

Data Processing

Analise os dados de forma rápida e simples no Apache Spark. A OVHcloud encarrega-se de implementar, em apenas alguns minutos, um cluster Apache Spark dedicado para tratar o seu pedido.

Começar gratuitamente

Ver os preços

Vantagens Vantagens
Casos práticos Casos práticos
Características Características
Documentação Documentação
Começar

Porquê escolher o Data Processing da OVHcloud?

Paralelização dos tratamentos

O Apache Spark permite-lhe explorar múltiplos nós de cálculo enquanto armazena as operações em memória RAM. Assim, o próprio cliente escolhe o nível de paralelização pretendido.

O cliente cria o código, nós implementamo-lo

Simplifique a sua vida! Somos nós que tratamos da implementação do cluster, o que permite que os nossos clientes se concentrem nas suas necessidades profissionais. Uma vez gerado o código Java ou Python, este último é executado diretamente no cluster.

Redução dos custos

Sempre que necessitar, crie um cluster dedicado em apenas alguns minutos. Após a conclusão da análise, o cluster é libertado. Já não precisa de conservar um cluster Apache Spark para operações de cálculo ocasionais.

Segurança e conformidade

A segurança dos seus dados é a nossa prioridade. Os nossos serviços estão em conformidade com as normas mais rigorosas (ISO/IEC 27001, ISO/IEC 27701, SOC 2 Type 2) em matéria de segurança e proteção da confidencialidade dos seus dados.

Exemplos de casos práticos

Relatórios de desempenho

Milhões de linhas de dados tabulares a tratar, milhares de tweets a analisar, vários KPI a calcular... O Data Processing permite-lhe agregar volumes maciços de informação para relatórios estratégicos usados em Data Science ou noutros domínios.

Conhecimento dos seus clientes

Pretende conhecer melhor as utilizações da sua clientela europeia ou os centros de interesse dos seus utilizadores? Graças à biblioteca MLib integrada no Apache Spark, pode saber mais sobre os seus clientes: percurso, hábitos, distribuição... tudo é possível!

Melhoria da experiência de compra

No setor do e-commerce, é primordial recomendar aos seus clientes todos os produtos que possam interessar-lhes. Para isso, torna-se necessário analisar os carrinhos de compra para detetar serviços complementares e os oferecer no momento mais apropriado.

ESPECIFICAÇÕES

Características técnicas

Saber mais

Inicialização

Carregue os dados e o código, e o serviço cria automaticamente um cluster.

Envie o seu projeto

O Apache Spark distribui a carga pelo cluster recém-implementado.

Obtenha o resultado

Uma vez prontos os cálculos, basta obter o resultado da análise.

Documentação

Primeiros passos

Saiba como usar a solução Data Processing

Saber mais

Manuais de utilização

Informe-se sobre os nossos serviços

Saber mais

Apache Spark

Introdução ao motor do serviço

Saber mais

Tutoriais

Descubra manuais criados especialmente para este serviço

Saber mais

Pronto para começar?

Crie uma conta e lance os seus serviços imediatamente

Beneficie de 200 € oferecidos no seu primeiro projeto Public Cloud

Começar agora

Estes produtos podem ser do seu interesse

Managed MongoDB

Execute a sua base de dados orientada para documentos NoSQL preferida. Comece já com o cluster Free Tier.

Managed Kubernetes Services

Livre-se da instalação e da manutenção dos seus clusters Kubernetes e implemente rapidamente aplicações graças a uma solução de orquestração de containers de referência.

Data Platform

Realize e implemente os seus projetos Data & Analytics em tempo recorde com uma solução completa, unificada, colaborativa e acessível a todos.

Respostas a questões frequentes

O que é o data processing?

O data processing, ou tratamento de dados, designa o processo de análise de dados brutos. Estas grandes quantidades de informação são cruciais para as empresas. Depois de tratadas, permitem uma melhor compreensão dos números de vendas, da eficácia de uma campanha de marketing ou ainda de um risco financeiro. Esta operação articula-se em várias etapas:

Recolha de dados. A quantidade de informações recolhidas influencia a qualidade do resultado. Podem provir de diferentes fontes: ficheiros de clientes, inventários, estudos anteriores... Para serem utilizáveis, devem ser fiáveis.
Preparação das informações. Trata-se de uma fase de limpeza das bases de dados. Destina-se a eliminar os elementos de má qualidade e/ou erros.
Importação dos dados trabalhados e início do tratamento. A automatização desta análise passa por um algoritmo de Machine Learning.
Interpretação dos dados. Este passo permite obter informações legíveis e compreensíveis por todos.
Armazenamento dos dados. Serve para conservar dados que poderão ser utilizados em futuros estudos.

Tenha em conta que o armazenamento de informações está sujeito a certas regulamentações, como o RGPD, que exige uma solução segura e conforme para o conjunto dos seus dados.