Pentaho andmete integreerimise õpetus: mis on Pentaho ETL tööriist

Mis on Pentaho BI?

Pentaho on äriteabe tööriist, mis pakub klientidele laia valikut ärianalüüsi lahendusi. See on võimeline aruandluseks, andmete analüüsimiseks, andmete integreerimiseks, andmete kaevandamiseks jne. Pentaho pakub ka laiaulatuslikku BI-funktsioonide komplekti, mis võimaldab teil parandada ettevõtte toimivust ja tõhusust.

Pentaho omadused

Järgmised on Pentaho olulised omadused:

  • ETL-i võimalused äriteabe vajadusteks
  • Pentaho aruannete kujundaja mõistmine
  • Toote ekspertiis
  • Pakub kõrvuti alamaruandeid
  • Uute võimaluste avamine
  • Professionaalne tugi
  • Päring ja aruandlus
  • Pakub täiustatud funktsionaalsust
  • Täielik käitusaja metaandmete tugi andmeallikatest

Pentaho BI sviit

Nüüd õpime Pentaho BI komplekti kohta sellest Pentaho õpetusest:

Pentaho BI sviit
Pentaho BI sviit

Pentaho BI Suite sisaldab järgmisi komponente:

Pentaho aruandlus

Pentaho aruandlus sõltub JFreeReporti projektist. See aitab teil täita oma ettevõtte aruandlusvajadusi. See komponent pakub ka nii ajastatud kui ka nõudmisel aruannete avaldamist populaarsetes vormingutes, nagu XLS, PDF, TXT ja HTML.

Analüüs

See pakub laias valikus analüüsi ja laias valikus funktsioone, sealhulgas pöördetabeli vaadet. Tööriist pakub täiustatud GUI funktsioone (kasutades Flashi või SVG-d), integreeritud armatuurlaua vidinaid, portaali ja töövoo integratsiooni.

Lisaks võimaldab Pentaho Spreadsheet Services kasutajal MS Excelis diagrammi sirvida, pöörata ja kasutada.

Verbi

Armatuurlaud pakub aruandlust ja analüüsi, mis lisavad sisu Pentaho armatuurlaudadesse. Iseteenindusega armatuurlaua kujundaja sisaldab ulatuslikke sisseehitatud armatuurlaua malle ja paigutust. See võimaldab ärikasutajatel vähese koolitusega luua isikupärastatud armatuurlaudu.

Data Mining

Andmekaeve tööriist avastab peidetud mustrid ja tulevase jõudluse näitajad. See pakub Weka projekti kõige põhjalikumat masinõppe algoritmide komplekti, mis hõlmab rühmitamist, otsustuspuid, juhuslikke metsi, põhikomponentide analüüsi ja närvivõrke.

See võimaldab teil andmeid graafiliselt vaadata, nendega programmiliselt suhelda või kasutada aruannete, edasise analüüsi ja muude protsesside jaoks mitut andmeallikat.

Pentaho andmete integreerimine

Seda komponenti kasutatakse andmete integreerimiseks kõikjal, kus need on olemas.

Rikkalik teisendusteek enam kui 150 karbist väljas oleva kaardistamisobjektiga.

See toetab laia valikut andmeallikaid, mis hõlmavad enam kui 30 avatud lähtekoodiga ja patenteeritud andmebaasiplatvormi, lamefaile. See aitab ka Suurandmete analüüs Hadoopi andmete integreerimise ja haldamisega.

Kes kasutavad Pentaho BI-d?

Pentaho BI on laialdaselt kasutatav tööriist, mida kasutavad tarkvaraprofessionaalid, näiteks:

  • Avatud lähtekoodiga tarkvaraprogrammid
  • Ärianalüütik ja teadlane
  • Tudengid
  • Ärianalüüsi nõunik

Kuidas installida Pentaho AWS-i

Järgnev on samm-sammult Pentaho installimine AWS-is.

Step 1) Klõpsake tellimiseks nuppu Jätka
Minna https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro ja klõpsake nuppu Jätka

Installige Pentaho AWS-i

Step 2) Nõustuge tingimustega
Järgmisel lehel nõustuge litsentsilepinguga

Installige Pentaho AWS-i

Step 3) Klõpsake nuppu Jätka konfiguratsiooni
Jätkake konfigureerimisega

Installige Pentaho AWS-i

Step 4) Käivitamiseks klõpsake nuppu Jätka
Jätke vaikeseaded ja klõpsake käivitamiseks

Installige Pentaho AWS-i

Step 5) Oodake käivitamiseks näiteks 5 minutit
Kontrollige kasutusjuhiseid ja oodake

Installige Pentaho AWS-i

Step 6) Hangi avalik IP
Kopeerige eksemplari avalik IP.

Installige Pentaho AWS-i

Step 7) Kasutage sisselogimiseks avalikku IP-d
Pentahole juurdepääsuks kleepige eksemplari avalik IP.

Installige Pentaho AWS-i

Pentaho eeltingimus

  • Riistvaranõuded
  • Tarkvara nõuded
  • Bl komplekti allalaadimine ja installimine
  • Bl komplekti käivitamine
  • Bl sviidi administreerimine

Riistvaranõue

Pentaho Bl Suite'i tarkvaral ei ole arvuti või võrguriistvara jaoks mingeid piiranguid seni, kuni suudate täita tarkvara miinimumnõudeid. Seda ärianalüüsi tööriista on lihtne installida. Siiski on soovitatav süsteemi spetsifikatsioonide komplekt:

RAM Minimaalselt 2 GB
Kõvakettaruum Minimaalselt 1 GB
Protsessor Kahetuumaline EM64T või AMD64

Tarkvara nõuded

  • Sun JRE 5.0 installimine
  • Keskkond võib olla kas 32-bitine või 64-bitine
  • Toetatud Operatingsüsteemid: Linux, Solaris, Windows, Mac
  • Tööjaam, millel on kaasaegne veebibrauseri liides, nagu Chrome, Internet Explorer, Firefox

Bl-serveri käivitamiseks

  • On Windows algusest, klõpsake nuppu Start Bl server ikoonil.
  • Linux OS-is käivitage skript start-pentaho /biserver-ce/kataloogis

Administraatoriserveri käivitamiseks

  • On Windows alustamise nupust klõpsake nuppu Start Bl enterprise server.
  • Linuxi jaoks: minge käsuaknasse ja käivitage käivitusskript kaustas /biserver-ce/administration-console/directory.

Administraatoriserveri peatamiseks

  • Serveri peatamiseks Windowsis klõpsake kahe serveri peatamise ikoonidel.
  • Linuxis. Peate minema terminali ja minema installitud kataloogi ja käivitama stop.bat

Pentaho halduskonsool

Aruandekujundaja

See on täiustatud aruannete loomise tööriist. See on ideaalne tööriist, kui soovite koostada täieliku andmedraivi aruande. See tööriist pakub palju paindlikkust ja funktsionaalsust kui Pentaho kasutajakonsooli ad hoc aruandlusvõimalused.

Disainstuudio

See on Eclipse-põhine tööriist. See võimaldab teil aruannet või analüüsi käsitsi redigeerida. Seda kasutatakse laialdaselt olemasolevasse aruandesse muudatuste lisamiseks, mida ei saa aruandekujundajaga lisada.

Agregatsiooni kujundaja

See graafiline tööriist võimaldab teil Mondriani kuubiku tõhusust parandada.

Metaandmete redaktor

Seda kasutatakse kohandatud metaandmekihi lisamiseks mis tahes olemasolevale andmeallikale.

Pentaho andmete integreerimine

Veekeetja ekstraktimise, teisendamise ja laadimise (ETL) tööriist, mis võimaldab

Pentaho Tool vs. BI virn

Pentaho tööriist BI virn
Andmete integreerimine (PDI) ETL
See pakub metaandmete redaktorit See pakub metaandmete haldamist
Pentaho BA Analytics
Aruannete kujundaja Operaaruandlus
Saiku Ad-hoc aruandlus
CDE Verbi
Pentaho kasutajakonsool (PUC) Juhtimine/järelevalve

Pentaho eelised

Nüüd selles Pentaho andmete integreerimise õpetuses õpime tundma Pentaho Business Intelligence Tooli mõningaid eeliseid:

  • Pentaho BI on väga intuitiivne tööriist. Mõne põhikontseptsiooni abil saate sellega töötada.
  • Lihtne ja hõlpsasti kasutatav äriteabe tööriist
  • Pakub laia valikut BI-võimalusi, sealhulgas aruandlust, armatuurlauda, ​​interaktiivset analüüsi, andmete integreerimist, andmekaevet jne.
  • Kaasas kasutajasõbralik liides ja pakub erinevaid tööriistu andmete toomiseks mitmest andmeallikast
  • Pakub ühtset paketti andmetega töötamiseks
  • Sellel on kogukonnaväljaanne paljude kaasautoritega ja Enterprise väljaanne.
  • Võimalus töötada Hadoopi klastris
  • JavaSammukomponentidesse kirjutatud skriptikoodi saab uuesti kasutada teistes komponentides.

Pentaho puudused

Siin on Pentaho BI tööriista kasutamise miinused / puudused:

  • Liidese disain võib olla nõrk ja kõigi komponentide jaoks puudub ühtne liides.
  • Palju aeglasem tööriista areng võrreldes teiste BI-tööriistadega.
  • Pentaho Business analytics pakub piiratud arvu komponente.
  • Kehv kogukonna toetus. Seega, kui te ei saa töötavat komponenti, peate ootama, kuni järgmine versioon avaldatakse.

kokkuvõte

  • Pentaho on äriteabe tööriist, mis pakub laia valikut ärianalüüsi lahendusi klientidele
  • See pakub ETL-i võimalusi äriteabe vajaduste jaoks.
  • Pentaho komplektid pakuvad selliseid komponente nagu aruanne, analüüs, armatuurlaud ja andmekaeve
  • Pentaho Business Intelligence'i kasutavad laialdaselt 1) ärianalüütikud 2) avatud lähtekoodiga tarkvara programmeerijad 3) teadur ja 4) üliõpilased.
  • Pentaho installiprotsess hõlmab: 1) riistvaranõudeid 2) tarkvaranõudeid, 3) Bl komplekti allalaadimist, 4) Bl komplekti käivitamist ja 5) Bl komplekti administreerimist.
  • Pentaho halduskonsooli olulised komponendid on 1) Report Designer, 2) Design Studio, 3) Agregation Designer 4) Metadata Editor 5) Pentaho Data Integration
  • Pentaho on andmete integreerimise (PDI) tööriist, samas kui BI-pinn on tööriist ETL tööriist.
  • Pentaho suurim eelis on äriteabe tööriista lihtne ja hõlpsasti kasutatav.
  • Pentaho peamine puudus on see, et see on palju aeglasem tööriista areng võrreldes teiste BI-tööriistadega