Apache NiFi-Tutorial

Zusammenfassung des Apache NiFi-Tutorials

Dieses Apache NiFi-Tutorial behandelt alle grundlegenden und fortgeschrittenen Themen von Grund auf. Sie lernen Konzepte wie NiFi-Definition, Geschichte, Architektur, Funktionen, Installationsprozess und Anwendungsfรคlle kennen. Sie erfahren auch, warum Sie Apache NiFi verwenden mรผssen und welche Best Practices fรผr die Ausfรผhrung von Apache NiFi gelten.

Was ist Apache NiFi?

Apache NiFi ist eine Open-Source-Software zur Automatisierung und Verwaltung des Datenflusses zwischen Systemen. Es handelt sich um ein leistungsstarkes und zuverlรคssiges System zur Verarbeitung und Verteilung von Daten. Es bietet eine webbasierte Benutzeroberflรคche zum Erstellen, รœberwachen und Steuern von Datenflรผssen. Es verfรผgt รผber einen hochgradig konfigurierbaren und modifizierbaren Datenflussprozess, um Daten zur Laufzeit zu รคndern.

Apache NiFi ist durch die Entwicklung benutzerdefinierter Komponenten leicht erweiterbar.

Warum Apache NIfi verwenden?

Hier sind Grรผnde fรผr die Verwendung von Apache Nifi:

  • Ermรถglicht Ihnen die Datenaufnahme, um Daten aus zahlreichen Datenquellen in NiFi einzulesen und Flow-Dateien zu erstellen
  • Es bietet Echtzeitsteuerung, die Ihnen hilft, die Datenbewegung zwischen jeder Quelle und jedem Ziel zu verwalten
  • Visualisieren Sie DataFlow auf Unternehmensebene
  • Stellen Sie gemeinsame Tools und Erweiterungen bereit
  • Ermรถglicht die Nutzung vorhandener Bibliotheken und Java ร–kosystemfunktionalitรคt
  • Hilft Organisationen bei der Integration von Nifi in ihre bestehende Infrastruktur
  • NiFi ist fรผr die Skalierung in Clustern konzipiert, die eine garantierte Datenรผbertragung bieten
  • Visualisieren und รผberwachen Sie Leistung und Verhalten in einem Flow-Bulletin, das Einblicke und Inline-Dokumentation bietet
  • Hilft Ihnen, Komponenten einzeln oder auf Gruppenebene zu starten und zu stoppen
  • Es hilft Ihnen, Datenflรผsse abzuhรถren, abzurufen, aufzuteilen, zu aggregieren, weiterzuleiten, zu transformieren und per Drag & Drop zu verschieben

Geschichte von Apache NiFi

  • รœber acht Jahre lang bei der NSA entwickelt
  • 2014 โ€“ Es wurde an Apache Software gespendet Foundation
  • 2015 โ€“ NiFi wurde offizieller Teil der Apache Project Suite
  • Seitdem verรถffentlicht Apache NiFi alle 6-8 Wochen ein neues Update

es sei denn Architektur

Apache NiFi hat eine gut durchdachte Architektur. Sobald Daten aus externen Quellen abgerufen werden, werden sie innerhalb der Apache NiFi-Architektur als FlowFile dargestellt.

es sei denn Architektur
es sei denn Architektur

Hier sind die Schlรผsselkomponenten der NiFi-Architektur

Nifi-Komponente Beschreibung
FlowFile Bei FlowFile handelt es sich um Originaldaten mit angehรคngten Metainformationen. Damit kรถnnen Sie nicht nur CSV- oder andere datensatzbasierte Daten verarbeiten, sondern auch Bilder, Videos, Audio oder andere Binรคrdaten.
Flowfile-Prozessor Fรผhrt die Arbeit aus, die als Baustein des Datenflusses in NiFi fungiert.
Durchflussregler Protokolliert, wie Prozesse miteinander verbunden sind. Es verwaltet die Threads und deren Zuordnungen, die alle Prozesse verwenden.
Web-Server Der Webserver hostet die HTTP-basierten Befehle und API von NiFi.
Erweiterung Es gibt viele Arten von NiFi-Erweiterungen, die innerhalb der JVM ausgefรผhrt werden.
Verbindungen schaffen Fungiert als Verbindung zwischen Prozessoren, die eine Warteschlange und Beziehungen enthalten, die sich darauf auswirken, wohin Daten weitergeleitet werden.
Gegendruck Verhindern Sie, dass das System รผberlastet wird, indem Sie die Menge oder DatengrรถรŸe der Flow-Dateien steuern, die in der Warteschlange gespeichert werden kรถnnen.
Prozessgruppe Eine Prozessgruppe ist eine Menge von Prozessen und deren Verbindungen, die mithilfe von Ports Daten empfangen und senden.
Flowfile-Repository Im FlowFile-Repository verfolgt NiFi den Status der Details, die es zu einem bestimmten FlowFile hat, das im Flow aktiv ist.
Inhalts-Repository Das Content Repository ist ein Bereich, in dem die tatsรคchlichen Inhaltsbytes einer bestimmten FlowFile vorhanden sind.
Provenienz-Repository Das Provenienz-Repository ist ein Bereich, in dem alle Daten zu Provenienzereignissen gesammelt werden.

Apache NiFi-Funktionen

  • NiFi unterstรผtzt die Pufferung aller in die Warteschlange gestellten Daten und bietet die Mรถglichkeit des Gegendrucks, wenn diese Warteschlangen bestimmte Grenzen erreichen kรถnnen.
  • NiFi ermรถglicht die Einstellung eines oder mehrerer Priorisierungsschemata
  • Stellt Verbindungsprozessoren fรผr viele Datenquellen bereit
  • Unterstรผtzt alle Gerรคte, auf denen Java
  • Ideal fรผr Orte mit eingeschrรคnkter Konnektivitรคt
  • Unterstรผtzung bei der Fehlerbehebung und Ablaufoptimierung
  • Bietet rollenbasierte Authentifizierung/Autorisierung
  • Ermรถglicht das Herunterladen, Wiederherstellen und Wiedergeben einzelner Dateien
  • Erstellen Sie Ihre Prozessoren, Controller-Dienste und mehr
  • Bieten Sie Inhaltsverschlรผsselung und Kommunikation รผber sichere Protokolle
  • Ermรถglicht eine schnelle Entwicklung und effektive Tests
  • Ermรถglicht die Entwicklung einfacher Einzelfunktionskomponenten, die wiederverwendet und kombiniert werden kรถnnen, um komplexere Ablรคufe zu erstellen
  • Ermรถglicht die Isolierung des Klassenladers fรผr eine einfachere Verwaltung von Abhรคngigkeiten

So installieren Sie Apache NiFi

Nachfolgend finden Sie eine Schritt-fรผr-Schritt-Anleitung fรผr die Installation von Apache NiFi

Schritt 1) Zurรผck Nach dem Link,

und klicken Sie auf โ€žWeiter abonnierenโ€œ

Installieren Sie Apache NiFi

Schritt 2) Auf der nรคchsten Seite,

Klicken Sie auf โ€žBedingungen akzeptierenโ€œ

Installieren Sie Apache NiFi

Schritt 3) Sie werden diese Seite sehen,

Vielen Dank, dass Sie dieses Produkt abonniert haben! Wir bearbeiten Ihre Anfrage.

Installieren Sie Apache NiFi

Schritt 4) Aktualisieren Sie die Seite nach 5 Minuten.

Klicken Sie auf โ€žWeiter zur Konfigurationโ€œ

Installieren Sie Apache NiFi

Schritt 5) Auf der nรคchsten Seite,

Behalten Sie die Standardeinstellungen bei und klicken Sie auf โ€žWeiter zum Startenโ€œ.

Installieren Sie Apache NiFi

Schritt 6) Auf der nรคchsten Seite,

Klicken Sie auf Starten. Mรถglicherweise mรผssen Sie einen Schlรผssel erstellen

Installieren Sie Apache NiFi

Schritt 7) Sie sehen diese Erfolgsmeldung.

Herzlichen Glรผckwunsch! Eine Instanz dieser Software wurde erfolgreich auf EC2 bereitgestellt!

Installieren Sie Apache NiFi

Schritt 8) Hinweis,

Die Instanz-ID und das รถffentliche DNS der EC2-Instanz

Installieren Sie Apache NiFi

Schritt 9) In der Sicherheitsgruppe

Fรผgen Sie die Regel fรผr den gesamten Datenverkehr zum eingehenden und ausgehenden Datenverkehr hinzu

Installieren Sie Apache NiFi

Schritt 10) Um auf Nifi zuzugreifen,

Verwenden Sie einfach die URL

http://publicdns:8080/nifi

In unserem Fall wird es

http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/

Mitglied: Administrator

Passwort: Instanz-ID

Installieren Sie Apache NiFi

Schritt 11) Du wirst sehen,

NiFi-Startbildschirm

Installieren Sie Apache NiFi

Nifi-Anwendungsfรคlle

Nachfolgend finden Sie eine Liste der Apache NiFi-Anwendungsfรคlle:

Branche Anwendungsbereich
Versicherung
  • Risiko- und Underwriting-Analyse
  • Schadensanalyse
  • Nutzungsabhรคngige Versicherung
  • Neue Produktentwicklung
Healthcare
  • Einzelansicht des Patienten
  • รœberwachung der Vitalfunktionen in Echtzeit
  • EMR-Optimierung
  • Optimierung der Lieferkette
Telekommunikation
  • Einzelansicht des Kunden
  • CDR-Analyse
  • Dynamische Bandbreitenzuweisung
Fertigungsindustrie
  • Vorbeugende Wartung
  • Optimierung der Lieferkette
  • Qualitรคtskontrolle
ร–l- und Gasindustrie
  • Echtzeit-รœberwachung
  • Einzelansicht des OperaProduktion
  • Wartungsintervalle planen
  • Archive & Analytics
  • Unstrukturierte Datenklassifizierung
Finanzdienstleistungen
  • Geldwรคschebekรคmpfung
  • Entdeckung eines Betruges
  • Risikodatenmanagement

Best Practices zum Ausfรผhren von Apache NiFi

  • Ideal zur Trennung von Test-/Entwicklungs-/Produktionsumgebungen in NiFi
  • Sie sollten Ihren Ablauf in Prozessgruppen unterteilen
  • Verwenden Sie eine Namenskonvention, verwenden Sie Kommentare und Beschriftungen
  • Organisieren Sie Ihre Projekte in drei Teile: Aufnahme, Test und รœberwachung
  • Verwenden Sie eindeutige Namen fรผr Variablen

Nachteil von Nifi

  • Sie benรถtigen prรคzise Sicherheits- und Compliance-Kontrollen
  • Fรผr die Arbeit mit Apache NiFi mรผssen Sie das zugrunde liegende System sehr gut kennen
  • Die Datenkette muss aufrechterhalten werden
  • Transport/Messaging reicht mรถglicherweise nicht aus
  • Der Bedarf an Datenzugriff รผbersteigt die verfรผgbaren Transportressourcen
  • Nicht alle Daten werden gleich erstellt
  • SSL und Autorisierung auf Themenebene sind mรถglicherweise nicht ausreichend

Zusammenfassung

  • Apache NiFi ist eine Open-Source-Software zur Automatisierung und Verwaltung des Datenflusses zwischen Systemen
  • NiFi ist fรผr die Skalierung in Clustern konzipiert, die eine garantierte Datenรผbertragung bieten
  • Nifi wurde รผber acht Jahre lang bei der NSA entwickelt
  • Sobald Daten aus externen Quellen abgerufen werden, werden sie innerhalb der Apache NiFi-Architektur als FlowFile dargestellt.
  • FlowFile, Prozessor, Controller, Webserver, Verbindung, Gegendruck, Repository sind wichtige Komponenten der NiFi-Architektur
  • Die Ausdruckssprache NiFi unterstรผtzt jedes Gerรคt, auf dem Java
  • Sie kรถnnen NiFi ganz einfach auf AWS installieren
  • NiFi wird in verschiedenen Branchen eingesetzt, unter anderem im Gesundheitswesen, im Versicherungswesen, in der Telekommunikation, im verarbeitenden Gewerbe, im Finanzwesen sowie in der ร–l- und Gasbranche
  • Als Best Practice gliedern Sie Ihre Projekte in drei Teile: Aufnahme, Test und รœberwachung

Fassen Sie diesen Beitrag mit folgenden Worten zusammen: