Tutorial do Hive para iniciantes

Resumo do tutorial do Hive


O Apache Hive ajuda a consultar e gerenciar grandes conjuntos de dados com muita rapidez. ร‰ um Ferramenta ETL para o ecossistema Hadoop. Neste tutorial do Apache Hive para iniciantes, vocรช aprenderรก os fundamentos do Hive e tรณpicos importantes como consultas HQL, extraรงรตes de dados, partiรงรตes, buckets e assim por diante. Esta sรฉrie de tutoriais do Hive ajudarรก vocรช a aprender os conceitos e conceitos bรกsicos do Hive.

O que devo saber?


Para aprender este tutorial de consulta do Hive, vocรช precisa de conhecimento bรกsico de SQL, Hadoop e o conhecimento de outras bases de dados serรก de ajuda adicional.

Plano de estudos do curso Hive

Introduรงรฃo

๐Ÿ‘‰ Lessem 1 O que รฉ o Hive? - Architextura e modos
๐Ÿ‘‰ Lessem 2 Baixe e instale o HIVE โ€” Como baixar e instalar o HIVE em Ubuntu
๐Ÿ‘‰ Lessem 3 Configuraรงรฃo do metastore HIVE โ€“ Por que usar MySQL?
๐Ÿ‘‰ Lessem 4 Tipos de dados de colmeia โ€” Criar e descartar banco de dados no Hive

Coisas avanรงadas

๐Ÿ‘‰ Lessem 1 Tabela de criaรงรฃo do Hive โ€“ Tipos e seu uso
๐Ÿ‘‰ Lessem 2 Divisรณrias e baldes Hive - Aprenda com o exemplo
๐Ÿ‘‰ Lessem 3 รndices e visualizaรงรฃo do Hive - Aprenda com o exemplo
๐Ÿ‘‰ Lessem 4 Consultas de colmeia - Aprenda com o exemplo
๐Ÿ‘‰ Lessem 5 Tutorial de junรงรฃo e subconsulta do Hive - Aprenda com o exemplo
๐Ÿ‘‰ Lessem 6 Tutorial da linguagem de consulta Hive - Construรญdas em Operatoros
๐Ÿ‘‰ Lessem 7 Funรงรฃo Colmeia โ€” Funรงรตes integradas e definidas pelo usuรกrio
๐Ÿ‘‰ Lessem 8 Colmeia ETL โ€” Carregando JSON, XML, exemplos de dados de texto
๐Ÿ‘‰ Lessem 9 Perguntas da entrevista do Hive โ€” Entrevista com os 40 melhores do The Hive: Perguntas e Respostas

Introduรงรฃo ao Hive

O Hive evoluiu como uma soluรงรฃo de armazenamento de dados construรญda sobre a estrutura Hadoop Map-Reduce.

O tamanho dos conjuntos de dados coletados e analisados โ€‹โ€‹na indรบstria para inteligรชncia de negรณcios estรก crescendo e, de certa forma, estรก tornando as soluรงรตes tradicionais de armazenamento de dados mais caras. Hadoop com o framework MapReduce, estรก sendo utilizado como uma soluรงรฃo alternativa para anรกlise de conjuntos de dados de grande tamanho. Embora o Hadoop tenha se mostrado รบtil para trabalhar em grandes conjuntos de dados, sua estrutura MapReduce รฉ de nรญvel muito baixo e exige que os programadores escrevam programas personalizados que sรฃo difรญceis de manter e reutilizar. O Hive vem aqui para resgatar programadores.


Motor colmeia compila essas consultas em tarefas Map-Reduce para serem executadas no Hadoop. Alรฉm disso, scripts Map-Reduce personalizados tambรฉm podem ser inseridos em consultas. O Hive opera em dados armazenados em tabelas que consistem em tipos de dados primitivos e tipos de dados de coleรงรฃo, como arrays e mapas.

O Hive vem com uma interface shell de linha de comando que pode ser usada para criar tabelas e executar consultas.

A linguagem de consulta Hive รฉ semelhante ao SQL, pois oferece suporte a subconsultas. Com a linguagem de consulta Hive, รฉ possรญvel fazer junรงรตes MapReduce em tabelas Hive. Possui suporte para simples Funรงรตes semelhantes a SQLโ€“ CONCAT, SUBSTR, ROUND etc., e funรงรตes de agregaรงรฃoโ€“ SUM, COUNT, MAX etc. Tambรฉm suporta clรกusulas GROUP BY e SORT BY. Tambรฉm รฉ possรญvel escrever funรงรตes definidas pelo usuรกrio na linguagem de consulta Hive.

O que รฉ o Hive?

Colmeia Apache รฉ uma estrutura de data warehouse para consulta e anรกlise de dados armazenados em HDFS. Ele รฉ desenvolvido em cima do Hadoop. Hive รฉ um software de cรณdigo aberto para analisar grandes conjuntos de dados no Hadoop. Ele fornece linguagem declarativa semelhante a SQL, chamada HiveQL, para expressar consultas. Usando o Hive-QL, os usuรกrios associados ao SQL pode realizar anรกlise de dados com muita facilidade.

Reduรงรฃo do mapa Hive vs.

Antes de escolher uma dessas duas opรงรตes, devemos examinar algumas de suas caracterรญsticas.

Ao escolher entre Hive e Map, reduza os seguintes fatores:

  • Tipo de dados
  • Quantidade de dados
  • Complexidade do Cรณdigo

Colmeia Vs Mapa Reduzido?

Caracterรญstica Colmรฉia Reduzir mapa
Lรญngua Suporta linguagem de consulta semelhante a SQL para interaรงรฃo e modelagem de dados
  • Ele compila a linguagem com duas tarefas principais presentes nela. Uma รฉ a tarefa de mapa e a outra รฉ um redutor.
  • Podemos definir essas tarefas usando Java or Python
Nรญvel de abstraรงรฃo Maior nรญvel de abstraรงรฃo no HDFS Nรญvel mais baixo de abstraรงรฃo
Eficiรชncia no Cรณdigo Comparativamente menor que a reduรงรฃo do mapa Fornece alta eficiรชncia
Extensรฃo do cรณdigo Less nรบmero de linhas de cรณdigo necessรกrias para execuรงรฃo Mais nรบmero de linhas de cรณdigos a serem definidas
Tipo de trabalho de desenvolvimento necessรกrio Less Trabalho de desenvolvimento necessรกrio ร‰ necessรกrio mais trabalho de desenvolvimento

Clique para o Prรณximo tutorial

Resuma esta postagem com: