Tutorial do Hive para iniciantes
Resumo do tutorial do Hive
O Apache Hive ajuda a consultar e gerenciar grandes conjuntos de dados com muita rapidez. ร um Ferramenta ETL para o ecossistema Hadoop. Neste tutorial do Apache Hive para iniciantes, vocรช aprenderรก os fundamentos do Hive e tรณpicos importantes como consultas HQL, extraรงรตes de dados, partiรงรตes, buckets e assim por diante. Esta sรฉrie de tutoriais do Hive ajudarรก vocรช a aprender os conceitos e conceitos bรกsicos do Hive.
O que devo saber?
Para aprender este tutorial de consulta do Hive, vocรช precisa de conhecimento bรกsico de SQL, Hadoop e o conhecimento de outras bases de dados serรก de ajuda adicional.
Plano de estudos do curso Hive
Introduรงรฃo
| ๐ Lessem 1 | O que รฉ o Hive? - Architextura e modos |
| ๐ Lessem 2 | Baixe e instale o HIVE โ Como baixar e instalar o HIVE em Ubuntu |
| ๐ Lessem 3 | Configuraรงรฃo do metastore HIVE โ Por que usar MySQL? |
| ๐ Lessem 4 | Tipos de dados de colmeia โ Criar e descartar banco de dados no Hive |
Coisas avanรงadas
| ๐ Lessem 1 | Tabela de criaรงรฃo do Hive โ Tipos e seu uso |
| ๐ Lessem 2 | Divisรณrias e baldes Hive - Aprenda com o exemplo |
| ๐ Lessem 3 | รndices e visualizaรงรฃo do Hive - Aprenda com o exemplo |
| ๐ Lessem 4 | Consultas de colmeia - Aprenda com o exemplo |
| ๐ Lessem 5 | Tutorial de junรงรฃo e subconsulta do Hive - Aprenda com o exemplo |
| ๐ Lessem 6 | Tutorial da linguagem de consulta Hive - Construรญdas em Operatoros |
| ๐ Lessem 7 | Funรงรฃo Colmeia โ Funรงรตes integradas e definidas pelo usuรกrio |
| ๐ Lessem 8 | Colmeia ETL โ Carregando JSON, XML, exemplos de dados de texto |
| ๐ Lessem 9 | Perguntas da entrevista do Hive โ Entrevista com os 40 melhores do The Hive: Perguntas e Respostas |
Introduรงรฃo ao Hive
O Hive evoluiu como uma soluรงรฃo de armazenamento de dados construรญda sobre a estrutura Hadoop Map-Reduce.
O tamanho dos conjuntos de dados coletados e analisados โโna indรบstria para inteligรชncia de negรณcios estรก crescendo e, de certa forma, estรก tornando as soluรงรตes tradicionais de armazenamento de dados mais caras. Hadoop com o framework MapReduce, estรก sendo utilizado como uma soluรงรฃo alternativa para anรกlise de conjuntos de dados de grande tamanho. Embora o Hadoop tenha se mostrado รบtil para trabalhar em grandes conjuntos de dados, sua estrutura MapReduce รฉ de nรญvel muito baixo e exige que os programadores escrevam programas personalizados que sรฃo difรญceis de manter e reutilizar. O Hive vem aqui para resgatar programadores.
Motor colmeia compila essas consultas em tarefas Map-Reduce para serem executadas no Hadoop. Alรฉm disso, scripts Map-Reduce personalizados tambรฉm podem ser inseridos em consultas. O Hive opera em dados armazenados em tabelas que consistem em tipos de dados primitivos e tipos de dados de coleรงรฃo, como arrays e mapas.
O Hive vem com uma interface shell de linha de comando que pode ser usada para criar tabelas e executar consultas.
A linguagem de consulta Hive รฉ semelhante ao SQL, pois oferece suporte a subconsultas. Com a linguagem de consulta Hive, รฉ possรญvel fazer junรงรตes MapReduce em tabelas Hive. Possui suporte para simples Funรงรตes semelhantes a SQLโ CONCAT, SUBSTR, ROUND etc., e funรงรตes de agregaรงรฃoโ SUM, COUNT, MAX etc. Tambรฉm suporta clรกusulas GROUP BY e SORT BY. Tambรฉm รฉ possรญvel escrever funรงรตes definidas pelo usuรกrio na linguagem de consulta Hive.
O que รฉ o Hive?
Colmeia Apache รฉ uma estrutura de data warehouse para consulta e anรกlise de dados armazenados em HDFS. Ele รฉ desenvolvido em cima do Hadoop. Hive รฉ um software de cรณdigo aberto para analisar grandes conjuntos de dados no Hadoop. Ele fornece linguagem declarativa semelhante a SQL, chamada HiveQL, para expressar consultas. Usando o Hive-QL, os usuรกrios associados ao SQL pode realizar anรกlise de dados com muita facilidade.
Reduรงรฃo do mapa Hive vs.
Antes de escolher uma dessas duas opรงรตes, devemos examinar algumas de suas caracterรญsticas.
Ao escolher entre Hive e Map, reduza os seguintes fatores:
- Tipo de dados
- Quantidade de dados
- Complexidade do Cรณdigo
Colmeia Vs Mapa Reduzido?
| Caracterรญstica | Colmรฉia | Reduzir mapa |
|---|---|---|
| Lรญngua | Suporta linguagem de consulta semelhante a SQL para interaรงรฃo e modelagem de dados |
|
| Nรญvel de abstraรงรฃo | Maior nรญvel de abstraรงรฃo no HDFS | Nรญvel mais baixo de abstraรงรฃo |
| Eficiรชncia no Cรณdigo | Comparativamente menor que a reduรงรฃo do mapa | Fornece alta eficiรชncia |
| Extensรฃo do cรณdigo | Less nรบmero de linhas de cรณdigo necessรกrias para execuรงรฃo | Mais nรบmero de linhas de cรณdigos a serem definidas |
| Tipo de trabalho de desenvolvimento necessรกrio | Less Trabalho de desenvolvimento necessรกrio | ร necessรกrio mais trabalho de desenvolvimento |
Clique para o Prรณximo tutorial
