Serviço de Data Processing
Data Processing
Analise os dados de forma rápida e simples no Apache Spark. A OVHcloud encarrega-se de implementar, em apenas alguns minutos, um cluster Apache Spark dedicado para tratar o seu pedido.
Porquê escolher o Data Processing da OVHcloud?
Paralelização dos tratamentos
O Apache Spark permite-lhe explorar múltiplos nós de cálculo enquanto armazena as operações em memória RAM. Assim, o próprio cliente escolhe o nível de paralelização pretendido.
O cliente cria o código, nós implementamo-lo
Simplifique a sua vida! Somos nós que tratamos da implementação do cluster, o que permite que os nossos clientes se concentrem nas suas necessidades profissionais. Uma vez gerado o código Java ou Python, este último é executado diretamente no cluster.
Redução dos custos
Sempre que necessitar, crie um cluster dedicado em apenas alguns minutos. Após a conclusão da análise, o cluster é libertado. Já não precisa de conservar um cluster Apache Spark para operações de cálculo ocasionais.
Segurança e conformidade
A segurança dos seus dados é a nossa prioridade. Os nossos serviços estão em conformidade com as normas mais rigorosas (ISO/IEC 27001, ISO/IEC 27701, SOC 2 Type 2) em matéria de segurança e proteção da confidencialidade dos seus dados.
Exemplos de casos práticos

Relatórios de desempenho
Milhões de linhas de dados tabulares a tratar, milhares de tweets a analisar, vários KPI a calcular... O Data Processing permite-lhe agregar volumes maciços de informação para relatórios estratégicos usados em Data Science ou noutros domínios.

Conhecimento dos seus clientes
Pretende conhecer melhor as utilizações da sua clientela europeia ou os centros de interesse dos seus utilizadores? Graças à biblioteca MLib integrada no Apache Spark, pode saber mais sobre os seus clientes: percurso, hábitos, distribuição... tudo é possível!

Melhoria da experiência de compra
No setor do e-commerce, é primordial recomendar aos seus clientes todos os produtos que possam interessar-lhes. Para isso, torna-se necessário analisar os carrinhos de compra para detetar serviços complementares e os oferecer no momento mais apropriado.
ESPECIFICAÇÕES
Características técnicas
Inicialização
Carregue os dados e o código, e o serviço cria automaticamente um cluster.
Envie o seu projeto
O Apache Spark distribui a carga pelo cluster recém-implementado.
Obtenha o resultado
Uma vez prontos os cálculos, basta obter o resultado da análise.
Documentação
Primeiros passos
Saiba como usar a solução Data Processing
Manuais de utilização
Informe-se sobre os nossos serviços
Apache Spark
Introdução ao motor do serviço
Tutoriais
Descubra manuais criados especialmente para este serviço
Estes produtos podem ser do seu interesse
Respostas a questões frequentes
O que é o data processing?
O data processing, ou tratamento de dados, designa o processo de análise de dados brutos. Estas grandes quantidades de informação são cruciais para as empresas. Depois de tratadas, permitem uma melhor compreensão dos números de vendas, da eficácia de uma campanha de marketing ou ainda de um risco financeiro. Esta operação articula-se em várias etapas:
- Recolha de dados. A quantidade de informações recolhidas influencia a qualidade do resultado. Podem provir de diferentes fontes: ficheiros de clientes, inventários, estudos anteriores... Para serem utilizáveis, devem ser fiáveis.
- Preparação das informações. Trata-se de uma fase de limpeza das bases de dados. Destina-se a eliminar os elementos de má qualidade e/ou erros.
- Importação dos dados trabalhados e início do tratamento. A automatização desta análise passa por um algoritmo de Machine Learning.
- Interpretação dos dados. Este passo permite obter informações legíveis e compreensíveis por todos.
- Armazenamento dos dados. Serve para conservar dados que poderão ser utilizados em futuros estudos.
Tenha em conta que o armazenamento de informações está sujeito a certas regulamentações, como o RGPD, que exige uma solução segura e conforme para o conjunto dos seus dados.