Apache NiFi-vejledning
Apache NiFi Tutorial Resumรฉ
Denne apache NiFi-tutorial dรฆkker alle de grundlรฆggende til avancerede emner fra bunden. Du vil lรฆre begreber som NiFi-definition, historie, arkitektur, funktioner, installationsproces, use cases. Du vil ogsรฅ lรฆre, hvorfor du skal bruge apache NiFi og de bedste fremgangsmรฅder for at kรธre apache NiFi.
Hvad er Apache NiFi?
Apache NiFi er en open source software til automatisering og styring af dataflowet mellem systemer. Det er et kraftfuldt og pรฅlideligt system til at behandle og distribuere data. Det giver webbaseret brugergrรฆnseflade til at oprette, overvรฅge og kontrollere datastrรธmme. Det har en meget konfigurerbar og modificerbar dataflowproces til at รฆndre data under kรธrsel.
Apache NiFi kan nemt udvides gennem udvikling af brugerdefinerede komponenter.
Hvorfor bruge Apache NIfi?
Her er grunde til at bruge Apache Nifi:
- Giver dig mulighed for at foretage dataindtagelse for at trรฆkke data ind i NiFi fra adskillige datakilder og oprette flowfiler
- Det tilbyder kontrol i realtid, som hjรฆlper dig med at styre bevรฆgelsen af โโdata mellem enhver kilde og destination
- Visualiser DataFlow pรฅ virksomhedsniveau
- Sรธrg for fรฆlles vรฆrktรธj og udvidelser
- Giver dig mulighed for at drage fordel af eksisterende biblioteker og Java รธkosystems funktionalitet
- Hjรฆlper organisationer med at integrere Nifi med deres eksisterende infrastruktur
- NiFi er designet til at skalere ud i klynger, som tilbyder garanteret levering af data
- Visualiser og overvรฅg ydeevne, adfรฆrd i en flowbulletin, der tilbyder indsigt og inline-dokumentation
- Hjรฆlper dig med at starte og stoppe komponenter separat eller pรฅ gruppeniveau
- Det hjรฆlper dig med at lytte, hente, opdele, samle, rute, transformere og trรฆkke og slippe Dataflow
Historien om Apache NiFi
- Udviklet hos NSA i over otte รฅr
- 2014- Det blev doneret til Apache-softwaren Foundation
- 2015- NiFi blev en officiel del af Apache Project Suite
- Siden da hver 6.-8. uge udgiver Apache NiFi en ny opdatering
NiFi Architecture
Apache NiFi har en gennemtรฆnkt arkitektur. Nรฅr data er hentet fra eksterne kilder, er det reprรฆsenteret som FlowFile inde i Apache NiFi-arkitekturen.

Her er nรธglekomponenterne i NiFi-arkitekturen
| Nifi komponent | Beskrivelse |
|---|---|
| FlowFile | FlowFile er originale data med metainformation knyttet til det. Det giver dig mulighed for at behandle ikke kun CSV eller andre optagelsesbaserede data, men ogsรฅ billeder, videoer, lyd eller andre binรฆre data. |
| Flowfil processor | Udfรธrer arbejdet, der fungerer som en byggesten af โโdataflow i NiFi. |
| Flow controller | Registrerer, hvordan processer er forbundet. Den administrerer trรฅdene og allokeringerne deraf, som alle processer bruger. |
| web-server | Webserveren er vรฆrt for NiFis HTTP-baserede kommandoer og API. |
| Extension | Der er mange typer af NiFi-udvidelser, som fungerer og udfรธres i JVM. |
| Forbindelse | Fungerer som en forbindelse mellem processorer, der indeholder en kรธ og relation(er), som pรฅvirker, hvor data rutes. |
| Rygpres | Stop systemet med at blive overrendt ved at kontrollere mรฆngden eller datastรธrrelsen af โโflowfiler, der kan gemmes i kรธen. |
| Procesgruppe | En procesgruppe er et sรฆt af processer og deres forbindelser, som modtager og sender data ved hjรฆlp af porte. |
| Flowfile Repository | I FlowFile Repository holder NiFi styr pรฅ tilstanden af, hvilke detaljer den har om en given FlowFile, som er aktiv i flowet. |
| Indholdsarkiv | Indholdslagret er et omrรฅde, hvor de faktiske indholdsbytes for en given FlowFile findes. |
| Herkomstdepot | Herkomstdepotet er et omrรฅde, hvor alle herkomsthรฆndelsesdata er indsamlet. |
Apache NiFi-funktioner
- NiFi understรธtter buffering af alle data i kรธ og giver mulighed for modtryk, da disse kรธer kan nรฅ specificerede grรฆnser
- NiFi tillader indstilling af en eller flere prioriteringsordninger
- Giver forbindelsesprocessorer til mange datakilder
- Understรธtte enhver enhed, der kรธrer Java
- Ideel til steder med begrรฆnset tilslutning
- Support til fejlfinding og flowoptimering
- Tilbyder rollebaseret godkendelse/autorisation
- Tillader download, gendannelse og genafspilning af individuelle filer
- Byg dine processorer, controllertjenester og mere
- Giv indholdskryptering, kommunikation over sikre protokoller
- Muliggรธr hurtig udvikling og effektiv test
- Giver mulighed for udvikling af simple enkeltfunktionskomponenter, der kan genbruges og kombineres for at lave mere komplekse flows
- Tillader isolering af klasseindlรฆser for lettere styring af afhรฆngigheder
Sรฅdan installeres Apache NiFi
Nedenfor er en trinvis proces til Apache NiFi-installation
Trin 1) Gรฅ til forbindelsen,
og klik pรฅ "Fortsรฆt med at abonnere"
Trin 2) Pรฅ nรฆste side,
Klik pรฅ "Accepter vilkรฅr"
Trin 3) Du vil se denne side,
Tak, fordi du abonnerer pรฅ dette produkt! Vi behandler din anmodning.
Trin 4) Opdater siden efter 5 minutter.
Klik pรฅ "Fortsรฆt til konfiguration"
Trin 5) Pรฅ nรฆste side,
Behold standardindstillingerne, og klik pรฅ "Fortsรฆt til start"
Trin 6) Pรฅ nรฆste side,
Klik pรฅ Start. Du skal muligvis oprette en nรธgle
Trin 7) Du vil se denne succesmeddelelse.
Tillykke! En forekomst af denne software er implementeret med succes pรฅ EC2!
Trin 8) Bemรฆrk,
Forekomst-id'et og den offentlige DNS for EC2-forekomsten
Trin 9) I sikkerhedsgruppen,
Fรธj al trafikregel til indgรฅende og udgรฅende
Trin 10) For at fรฅ adgang til Nifi,
brug blot URL'en
http://publicdns:8080/nifi
I vores tilfรฆlde bliver det
http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/
Bruger:admin
Adgangskode: Forekomst-id
Trin 11) Du vil se,
NiFi-hjemmeskรฆrm
Nifi Use Cases
Nedenfor er en liste over Apache NiFi-brugstilfรฆlde:
| Industri | Brug |
|---|---|
| Forsikring |
|
| HealthCare |
|
| Telekommunikation |
|
| Manufacturing |
|
| Olie & Gas- Industri |
|
| Financial Services |
|
Bedste รธver sig i at kรธre Apache NiFi
- Ideel til at adskille test/dev/produktionsmiljรธer i NiFi
- Du bรธr opdele dit flow i procesgrupper
- Brug en navnekonvention, brug kommentarer og etiketter
- Organiser dine projekter i tre dele indtagelse, test og overvรฅgning
- Brug unikke navne til variable
Ulempen ved Nifi
- Har brug for prรฆcise sikkerheds- og overholdelseskontroller
- Du skal kende det underliggende system meget godt, mens du arbejder med Apache NiFi
- Skal opretholde chain of custody for data
- Transport/beskeder er muligvis ikke nok
- Behovet for dataadgang overstiger de tilgรฆngelige ressourcer til transport
- Ikke alle data er skabt lige
- SSL- og emneniveau-autorisation er muligvis ikke tilstrรฆkkelig
Resumรฉ
- Apache NiFi er en open source-software til automatisering og styring af datastrรธmmen mellem systemer
- NiFi er designet til at skalere ud i klynger, som tilbyder garanteret levering af data
- Nifi blev udviklet hos NSA i over otte รฅr
- Nรฅr data er hentet fra eksterne kilder, er det reprรฆsenteret som FlowFile inde i Apache NiFi-arkitekturen.
- FlowFile, processor, controller, webserver, forbindelse, modtryk, repository er vigtige komponenter i NiFi-arkitekturen
- NiFi-udtrykssprog understรธtter enhver enhed, der kรธrer Java
- Du kan nemt installere NiFi pรฅ AWS
- NiFi bruges i forskellige industrier sรฅsom sundhedspleje, forsikring, telekom, fremstilling, finans, olie og gas blandt andre
- Som en bedste praksis skal du organisere dine projekter i tre dele indtagelse, test og overvรฅgning











