HBase'i õpetus algajatele: mis on HBase? Õppige 3 päevaga!
HBase'i õpetuse kokkuvõte
Mis on HBase?
HBase on avatud lähtekoodiga veerule orienteeritud hajutatud andmebaasisüsteem a hadoop keskkond. Algselt oli see Google Big Table, hiljem; see nimetati ümber kui HBase ja see on peamiselt kirjutatud Java. Apache HBase on vajalik reaalajas suurandmete rakenduste jaoks.HBase suudab salvestada tohutul hulgal andmeid terabaitidest petabaitideni. HBase'is olevad tabelid koosnevad miljarditest ridadest, millel on miljoneid veerge. HBase on loodud madala latentsusajaga toimingute jaoks, millel on traditsiooniliste relatsioonimudelitega võrreldes mõned eripärad. Loe rohkem…
HBase'i koolituse ainekava
Siin on see, mida me selles Apache HBase'i koolitusjuhendis käsitleme
| 👉 Lessaasta 1 | ArchiHBase'i struktuur - HBase Architektuur, komponendid ja andmemudel |
| 👉 Lessaasta 2 | HBase'i installimine — HBase'i installimine on sisse lülitatud Ubuntu |
| 👉 Lessaasta 3 | HBase Shelli käsud — Õppige näitega |
| 👉 Lessaasta 4 | HBase Loo tabel — HBase'is tabeli loomise sammud kasutades Java API |
| 👉 Lessaasta 5 | Andmete sisestamine ja toomine HBase'is — get(), pane(), scan() Näited |
| 👉 Lessaasta 6 | HBase'i jõudluse kitsaskohad — HBase'i eelised ja piirangud |
| 👉 Lessaasta 7 | Hbase'i intervjuu küsimused — 30 parimat Hbase'i intervjuu küsimust ja vastust |
Mida saate sellest HBase'i õpetusest algajatele teada?
Sellest HBase'i õpetusest algajatele saate teada, mis on Apache HBase ArchiHBase'i tehnoloogia, HBase'i installimine, HBase'i tabeli loomise sammud, HBase'i eelised ja piirangud jne.
Miks valida HBase?
Populaarse veebirakenduse tabel võib koosneda miljarditest ridadest. Kui tahame otsida konkreetset rida nii suure hulga andmete hulgast, on HBase ideaalne valik, kuna päringu toomise aeg on lühem. Enamik veebianalüütikarakendusi kasutab HBase'i.
Traditsioonilised relatsioonilised andmemudelid ei vasta väga suurte andmebaaside jõudlusnõuetele. Neid jõudluse ja töötlemise piiranguid saab ületada Apache HBase.
Apache HBase'i funktsioonid
- HBase on loodud madala latentsusega toimingute jaoks
- HBase'i kasutatakse laialdaselt juhuslike lugemis- ja kirjutamisoperatsioonide jaoks
- HBase salvestab suure hulga andmeid tabelite kujul
- Pakub lineaarset ja modulaarset skaleeritavust klastrikeskkonnas
- Lugemis- ja kirjutamistoimingud on rangelt järjekindlad
- Tabelite automaatne ja konfigureeritav jagamine
- Automaatne tõrkesiirde tugi piirkonna serverite vahel
- Mugavad baasklassid toetamiseks Hadoop MapReduce töökohad HBase'i tabelites
- Lihtne kasutada Java API kliendi juurdepääsuks
- Blokeeri vahemälu ja Bloomi filtrid reaalajas päringute jaoks
- Päringu predikaat surub serveripoolsete filtrite kaudu alla.
NoSQL-i andmebaaside tähtsus Hadoopis
Suurandmete analüütikas hadoop mängib olulist rolli tüüpiliste äriprobleemide lahendamisel, haldades suuri andmekogumeid ja pakub parimaid lahendusi analüüsivaldkonnas.
Hadoopi ökosüsteemis mängib iga komponent oma ainulaadset rolli
-
Andmetöötlus
-
Andmete valideerimine
-
Andmete salvestamine
Struktureerimata, poolstruktureeritud andmete salvestamise ja selliste andmete otsimise seisukohalt on relatsiooniandmebaasid vähem kasulikud. Samuti on keeruline ülesanne tulemuste toomine, rakendades päringuid Hadoopi salvestusruumi salvestatud tohututele andmekogumitele. NoSQL-i salvestustehnoloogiad pakuvad parimat lahendust tohutute andmekogumite kiiremaks päringute tegemiseks.
Muu NoSQL-i salvestustüüp Andmebaasid
Mõned turul olevad NoSQL-i mudelid on Cassandra, MongoDBja CouchDB. Kõigil neil mudelitel on erinevad salvestusmehhanismid.
Näiteks MongoDB on dokumendile orienteeritud andmebaas NoSQL sugupuust. Võrreldes traditsiooniliste andmebaasidega pakub see jõudluse, saadavuse ja skaleeritavuse osas parimaid funktsioone. See on avatud lähtekoodiga dokumendile orienteeritud andmebaas ja see on sisse kirjutatud C++.
Cassandra on ka avatud lähtekoodiga Apache tarkvara hajutatud andmebaas, mis on loodud käsitlema tohutul hulgal kaubaserverites salvestatud andmeid. Cassandra tagab kõrge kättesaadavuse ilma ühe tõrkepunktita.
Kui CouchDB on dokumendile orienteeritud andmebaas, milles kõik dokumendiväljad on salvestatud võtmeväärtuste kaartidel.
Mille poolest HBase erineb teistest NoSQL-i mudelitest
HBase'i salvestusmudel erineb teistest ülalpool käsitletud NoSQL-i mudelitest. Seda võib väita järgmiselt.
-
HBase salvestab andmed võtme/väärtuse paaride kujul veergmudelis. Selles mudelis on kõik veerud rühmitatud veergude perekondadeks.
-
HBase pakub paindlikku andmemudelit ja madala latentsusega juurdepääsu väikestele andmemahtudele, mis on salvestatud suurtesse andmekogumitesse.
-
Hadoopi peal olev HBase suurendab hajutatud klastri seadistamise läbilaskevõimet ja jõudlust. See omakorda pakub kiiremaid juhuslikke lugemis- ja kirjutamistoiminguid.
Millist NoSQL-i andmebaasi valida?
MongoDB, CouchDBja Cassandra on NoSQL-tüüpi andmebaasid, mis on funktsioonispetsiifilised ja mida kasutatakse vastavalt nende ärivajadustele. Siin oleme vastavalt nende kasutusjuhtumitele välja toonud erinevad NoSQL-i andmebaasid.
| Andmebaasi tüüp Põhineb funktsioonil | Andmebaasi näide | Kasutusjuhtum (millal kasutada) |
|---|---|---|
| Võti/ väärtus | Redis, MemcacheDB | Vahemällu salvestamine, järjekorda seadmine, teabe levitamine |
| Veerule orienteeritud | Cassandra, HBase | Skaleerimine, struktureerimata hoidmine, püsimatu |
| Dokumendile orienteeritud | MongoDB, diivanialus | Pesastatud teave, JavaSkriptisõbralik |
| Graafikupõhine | OrientDB, Neo4J | Keerulise relatsiooniteabe käsitlemine. Modelleerimise ja käitlemise klassifikatsioon. |
HBase vs. Taru
| FUNKTSIOONID | HBase | Mesilaspere |
|---|---|---|
| Andmebaasi mudel | Laia kolonni pood | Relatsiooniline andmebaasisüsteem |
| Andmeskeem | Skeemivaba | Skeemiga |
| SQL-i tugi | Ei | Jah, see kasutab HQL-i (Hive päringukeel) |
| Jaotamise meetodid | Varjutamine | Varjutamine |
| Järjepidevuse tase | Vahetu järjepidevus | Lõplik järjepidevus |
| Sekundaarsed indeksid | Ei | Jah |
| Replikatsioonimeetodid | Valitav replikatsioonitegur | Valitav replikatsioonitegur |
HBase vs. RDBMS
Võrreldes HBase'i traditsiooniliste relatsiooniandmebaasidega, peame arvestama kolme põhivaldkonnaga. Need on andmemudel, andmesalvestus ja andmete mitmekesisus.
| HBASE | RDBMS |
|---|---|
| • Skeemivaba andmebaasis | • Andmebaasis fikseeritud skeemi olemasolu |
| • Veergudepõhised andmebaasid | • Reapõhine andmehoidla |
| • Loodud denormaliseeritud andmete salvestamiseks | • Mõeldud normaliseeritud andmete salvestamiseks |
| • HBase'is on laiad ja hõredalt asustatud tabelid | • Sisaldab andmebaasis õhukesi tabeleid |
| • Toetab automaatset partitsioonimist | • Puudub sisseehitatud tugi partitsioonimiseks |
| • Sobib hästi OLAP-süsteemidele | • Sobib hästi OLTP-süsteemidele |
| • Loe andmebaasist ainult asjakohaseid andmeid | • Hankige üks rida korraga ja seega võite lugeda ebavajalikke andmeid, kui vaja on ainult osa rea andmetest |
| • Struktureeritud ja poolstruktuurilisi andmeid saab salvestada ja töödelda HBase'i abil | • Struktureeritud andmeid saab salvestada ja töödelda RDBMS-i abil |
| • Võimaldab koondamist paljude ridade ja veergude kaupa | • Koondamine on kulukas tegevus |
kokkuvõte
HBase pakub ainulaadseid funktsioone ja lahendab tüüpilised tööstusliku kasutuse juhtumid. Veerule orienteeritud salvestusruumina pakub see kiiret päringuid, tulemuste toomist ja suurt hulka andmesalvestust. See kursus on HBase'i täielik samm-sammult tutvustus.
