Apache NiFi-Tutorial
Zusammenfassung des Apache NiFi-Tutorials
Dieses Apache NiFi-Tutorial behandelt alle grundlegenden und fortgeschrittenen Themen von Grund auf. Sie lernen Konzepte wie NiFi-Definition, Geschichte, Architektur, Funktionen, Installationsprozess und Anwendungsfรคlle kennen. Sie erfahren auch, warum Sie Apache NiFi verwenden mรผssen und welche Best Practices fรผr die Ausfรผhrung von Apache NiFi gelten.
Was ist Apache NiFi?
Apache NiFi ist eine Open-Source-Software zur Automatisierung und Verwaltung des Datenflusses zwischen Systemen. Es handelt sich um ein leistungsstarkes und zuverlรคssiges System zur Verarbeitung und Verteilung von Daten. Es bietet eine webbasierte Benutzeroberflรคche zum Erstellen, รberwachen und Steuern von Datenflรผssen. Es verfรผgt รผber einen hochgradig konfigurierbaren und modifizierbaren Datenflussprozess, um Daten zur Laufzeit zu รคndern.
Apache NiFi ist durch die Entwicklung benutzerdefinierter Komponenten leicht erweiterbar.
Warum Apache NIfi verwenden?
Hier sind Grรผnde fรผr die Verwendung von Apache Nifi:
- Ermรถglicht Ihnen die Datenaufnahme, um Daten aus zahlreichen Datenquellen in NiFi einzulesen und Flow-Dateien zu erstellen
- Es bietet Echtzeitsteuerung, die Ihnen hilft, die Datenbewegung zwischen jeder Quelle und jedem Ziel zu verwalten
- Visualisieren Sie DataFlow auf Unternehmensebene
- Stellen Sie gemeinsame Tools und Erweiterungen bereit
- Ermรถglicht die Nutzung vorhandener Bibliotheken und Java รkosystemfunktionalitรคt
- Hilft Organisationen bei der Integration von Nifi in ihre bestehende Infrastruktur
- NiFi ist fรผr die Skalierung in Clustern konzipiert, die eine garantierte Datenรผbertragung bieten
- Visualisieren und รผberwachen Sie Leistung und Verhalten in einem Flow-Bulletin, das Einblicke und Inline-Dokumentation bietet
- Hilft Ihnen, Komponenten einzeln oder auf Gruppenebene zu starten und zu stoppen
- Es hilft Ihnen, Datenflรผsse abzuhรถren, abzurufen, aufzuteilen, zu aggregieren, weiterzuleiten, zu transformieren und per Drag & Drop zu verschieben
Geschichte von Apache NiFi
- รber acht Jahre lang bei der NSA entwickelt
- 2014 โ Es wurde an Apache Software gespendet Foundation
- 2015 โ NiFi wurde offizieller Teil der Apache Project Suite
- Seitdem verรถffentlicht Apache NiFi alle 6-8 Wochen ein neues Update
es sei denn Architektur
Apache NiFi hat eine gut durchdachte Architektur. Sobald Daten aus externen Quellen abgerufen werden, werden sie innerhalb der Apache NiFi-Architektur als FlowFile dargestellt.

Hier sind die Schlรผsselkomponenten der NiFi-Architektur
| Nifi-Komponente | Beschreibung |
|---|---|
| FlowFile | Bei FlowFile handelt es sich um Originaldaten mit angehรคngten Metainformationen. Damit kรถnnen Sie nicht nur CSV- oder andere datensatzbasierte Daten verarbeiten, sondern auch Bilder, Videos, Audio oder andere Binรคrdaten. |
| Flowfile-Prozessor | Fรผhrt die Arbeit aus, die als Baustein des Datenflusses in NiFi fungiert. |
| Durchflussregler | Protokolliert, wie Prozesse miteinander verbunden sind. Es verwaltet die Threads und deren Zuordnungen, die alle Prozesse verwenden. |
| Web-Server | Der Webserver hostet die HTTP-basierten Befehle und API von NiFi. |
| Erweiterung | Es gibt viele Arten von NiFi-Erweiterungen, die innerhalb der JVM ausgefรผhrt werden. |
| Verbindungen schaffen | Fungiert als Verbindung zwischen Prozessoren, die eine Warteschlange und Beziehungen enthalten, die sich darauf auswirken, wohin Daten weitergeleitet werden. |
| Gegendruck | Verhindern Sie, dass das System รผberlastet wird, indem Sie die Menge oder Datengrรถรe der Flow-Dateien steuern, die in der Warteschlange gespeichert werden kรถnnen. |
| Prozessgruppe | Eine Prozessgruppe ist eine Menge von Prozessen und deren Verbindungen, die mithilfe von Ports Daten empfangen und senden. |
| Flowfile-Repository | Im FlowFile-Repository verfolgt NiFi den Status der Details, die es zu einem bestimmten FlowFile hat, das im Flow aktiv ist. |
| Inhalts-Repository | Das Content Repository ist ein Bereich, in dem die tatsรคchlichen Inhaltsbytes einer bestimmten FlowFile vorhanden sind. |
| Provenienz-Repository | Das Provenienz-Repository ist ein Bereich, in dem alle Daten zu Provenienzereignissen gesammelt werden. |
Apache NiFi-Funktionen
- NiFi unterstรผtzt die Pufferung aller in die Warteschlange gestellten Daten und bietet die Mรถglichkeit des Gegendrucks, wenn diese Warteschlangen bestimmte Grenzen erreichen kรถnnen.
- NiFi ermรถglicht die Einstellung eines oder mehrerer Priorisierungsschemata
- Stellt Verbindungsprozessoren fรผr viele Datenquellen bereit
- Unterstรผtzt alle Gerรคte, auf denen Java
- Ideal fรผr Orte mit eingeschrรคnkter Konnektivitรคt
- Unterstรผtzung bei der Fehlerbehebung und Ablaufoptimierung
- Bietet rollenbasierte Authentifizierung/Autorisierung
- Ermรถglicht das Herunterladen, Wiederherstellen und Wiedergeben einzelner Dateien
- Erstellen Sie Ihre Prozessoren, Controller-Dienste und mehr
- Bieten Sie Inhaltsverschlรผsselung und Kommunikation รผber sichere Protokolle
- Ermรถglicht eine schnelle Entwicklung und effektive Tests
- Ermรถglicht die Entwicklung einfacher Einzelfunktionskomponenten, die wiederverwendet und kombiniert werden kรถnnen, um komplexere Ablรคufe zu erstellen
- Ermรถglicht die Isolierung des Klassenladers fรผr eine einfachere Verwaltung von Abhรคngigkeiten
So installieren Sie Apache NiFi
Nachfolgend finden Sie eine Schritt-fรผr-Schritt-Anleitung fรผr die Installation von Apache NiFi
Schritt 1) Zurรผck Nach dem Link,
und klicken Sie auf โWeiter abonnierenโ
Schritt 2) Auf der nรคchsten Seite,
Klicken Sie auf โBedingungen akzeptierenโ
Schritt 3) Sie werden diese Seite sehen,
Vielen Dank, dass Sie dieses Produkt abonniert haben! Wir bearbeiten Ihre Anfrage.
Schritt 4) Aktualisieren Sie die Seite nach 5 Minuten.
Klicken Sie auf โWeiter zur Konfigurationโ
Schritt 5) Auf der nรคchsten Seite,
Behalten Sie die Standardeinstellungen bei und klicken Sie auf โWeiter zum Startenโ.
Schritt 6) Auf der nรคchsten Seite,
Klicken Sie auf Starten. Mรถglicherweise mรผssen Sie einen Schlรผssel erstellen
Schritt 7) Sie sehen diese Erfolgsmeldung.
Herzlichen Glรผckwunsch! Eine Instanz dieser Software wurde erfolgreich auf EC2 bereitgestellt!
Schritt 8) Hinweis,
Die Instanz-ID und das รถffentliche DNS der EC2-Instanz
Schritt 9) In der Sicherheitsgruppe
Fรผgen Sie die Regel fรผr den gesamten Datenverkehr zum eingehenden und ausgehenden Datenverkehr hinzu
Schritt 10) Um auf Nifi zuzugreifen,
Verwenden Sie einfach die URL
http://publicdns:8080/nifi
In unserem Fall wird es
http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/
Mitglied: Administrator
Passwort: Instanz-ID
Schritt 11) Du wirst sehen,
NiFi-Startbildschirm
Nifi-Anwendungsfรคlle
Nachfolgend finden Sie eine Liste der Apache NiFi-Anwendungsfรคlle:
| Branche | Anwendungsbereich |
|---|---|
| Versicherung |
|
| Healthcare |
|
| Telekommunikation |
|
| Fertigungsindustrie |
|
| รl- und Gasindustrie |
|
| Finanzdienstleistungen |
|
Best Practices zum Ausfรผhren von Apache NiFi
- Ideal zur Trennung von Test-/Entwicklungs-/Produktionsumgebungen in NiFi
- Sie sollten Ihren Ablauf in Prozessgruppen unterteilen
- Verwenden Sie eine Namenskonvention, verwenden Sie Kommentare und Beschriftungen
- Organisieren Sie Ihre Projekte in drei Teile: Aufnahme, Test und รberwachung
- Verwenden Sie eindeutige Namen fรผr Variablen
Nachteil von Nifi
- Sie benรถtigen prรคzise Sicherheits- und Compliance-Kontrollen
- Fรผr die Arbeit mit Apache NiFi mรผssen Sie das zugrunde liegende System sehr gut kennen
- Die Datenkette muss aufrechterhalten werden
- Transport/Messaging reicht mรถglicherweise nicht aus
- Der Bedarf an Datenzugriff รผbersteigt die verfรผgbaren Transportressourcen
- Nicht alle Daten werden gleich erstellt
- SSL und Autorisierung auf Themenebene sind mรถglicherweise nicht ausreichend
Zusammenfassung
- Apache NiFi ist eine Open-Source-Software zur Automatisierung und Verwaltung des Datenflusses zwischen Systemen
- NiFi ist fรผr die Skalierung in Clustern konzipiert, die eine garantierte Datenรผbertragung bieten
- Nifi wurde รผber acht Jahre lang bei der NSA entwickelt
- Sobald Daten aus externen Quellen abgerufen werden, werden sie innerhalb der Apache NiFi-Architektur als FlowFile dargestellt.
- FlowFile, Prozessor, Controller, Webserver, Verbindung, Gegendruck, Repository sind wichtige Komponenten der NiFi-Architektur
- Die Ausdruckssprache NiFi unterstรผtzt jedes Gerรคt, auf dem Java
- Sie kรถnnen NiFi ganz einfach auf AWS installieren
- NiFi wird in verschiedenen Branchen eingesetzt, unter anderem im Gesundheitswesen, im Versicherungswesen, in der Telekommunikation, im verarbeitenden Gewerbe, im Finanzwesen sowie in der รl- und Gasbranche
- Als Best Practice gliedern Sie Ihre Projekte in drei Teile: Aufnahme, Test und รberwachung











