custom background image

Serviço de Data Processing


Data Processing

Analise os dados de forma rápida e simples no Apache Spark. A OVHcloud encarrega-se de implementar, em apenas alguns minutos, um cluster Apache Spark dedicado para tratar o seu pedido.

Porquê escolher o Data Processing da OVHcloud?

Paralelização dos tratamentos

O Apache Spark permite-lhe explorar múltiplos nós de cálculo enquanto armazena as operações em memória RAM. Assim, o próprio cliente escolhe o nível de paralelização pretendido.

O cliente cria o código, nós implementamo-lo

Simplifique a sua vida! Somos nós que tratamos da implementação do cluster, o que permite que os nossos clientes se concentrem nas suas necessidades profissionais. Uma vez gerado o código Java ou Python, este último é executado diretamente no cluster.

Redução dos custos

Sempre que necessitar, crie um cluster dedicado em apenas alguns minutos. Após a conclusão da análise, o cluster é libertado. Já não precisa de conservar um cluster Apache Spark para operações de cálculo ocasionais. 

Segurança e conformidade

A segurança dos seus dados é a nossa prioridade. Os nossos serviços estão em conformidade com as normas mais rigorosas (ISO/IEC 27001, ISO/IEC 27701, SOC 2 Type 2) em matéria de segurança e proteção da confidencialidade dos seus dados. 

Exemplos de casos práticos

predictible OVHcloud

Relatórios de desempenho

Milhões de linhas de dados tabulares a tratar, milhares de tweets a analisar, vários KPI a calcular... O Data Processing permite-lhe agregar volumes maciços de informação para relatórios estratégicos usados em Data Science ou noutros domínios.

Community oriented

Conhecimento dos seus clientes

Pretende conhecer melhor as utilizações da sua clientela europeia ou os centros de interesse dos seus utilizadores? Graças à biblioteca MLib integrada no Apache Spark, pode saber mais sobre os seus clientes: percurso, hábitos, distribuição... tudo é possível!

Qualitative OVHcloud

Melhoria da experiência de compra

No setor do e-commerce, é primordial recomendar aos seus clientes todos os produtos que possam interessar-lhes. Para isso, torna-se necessário analisar os carrinhos de compra para detetar serviços complementares e os oferecer no momento mais apropriado.

ESPECIFICAÇÕES

Características técnicas

Inicialização

Carregue os dados e o código, e o serviço cria automaticamente um cluster.

Envie o seu projeto

O Apache Spark distribui a carga pelo cluster recém-implementado.

Obtenha o resultado

Uma vez prontos os cálculos, basta obter o resultado da análise.

Documentação

Primeiros passos

Saiba como usar a solução Data Processing

Manuais de utilização

Informe-se sobre os nossos serviços

Apache Spark

Introdução ao motor do serviço

Tutoriais

Descubra manuais criados especialmente para este serviço

Respostas a questões frequentes

O que é o data processing?

O data processing, ou tratamento de dados, designa o processo de análise de dados brutos. Estas grandes quantidades de informação são cruciais para as empresas. Depois de tratadas, permitem uma melhor compreensão dos números de vendas, da eficácia de uma campanha de marketing ou ainda de um risco financeiro. Esta operação articula-se em várias etapas:

  • Recolha de dados. A quantidade de informações recolhidas influencia a qualidade do resultado. Podem provir de diferentes fontes: ficheiros de clientes, inventários, estudos anteriores... Para serem utilizáveis, devem ser fiáveis.
  • Preparação das informações. Trata-se de uma fase de limpeza das bases de dados. Destina-se a eliminar os elementos de má qualidade e/ou erros.
  • Importação dos dados trabalhados e início do tratamento. A automatização desta análise passa por um algoritmo de Machine Learning.
  • Interpretação dos dados. Este passo permite obter informações legíveis e compreensíveis por todos.
  • Armazenamento dos dados. Serve para conservar dados que poderão ser utilizados em futuros estudos. 

Tenha em conta que o armazenamento de informações está sujeito a certas regulamentações, como o RGPD, que exige uma solução segura e conforme para o conjunto dos seus dados.