Teradata-Tutorial: Was ist Teradata SQL? Datenbank Architektur
Was ist Teradata?
Teradata ist ein Open-Source-Datenbankverwaltungssystem fรผr die Entwicklung umfangreicher Data-Warehousing-Anwendungen. Dieses Tool unterstรผtzt mehrere Data-Warehouse-Operationen gleichzeitig mithilfe des Konzepts der Parallelitรคt. Teradata ist ein massiv offenes Verarbeitungssystem, das Unix/Linux/ unterstรผtzt.Windows Serverplattformen.
Teradata-Software wird von der Teradata Corporation entwickelt, einem amerikanischen IT-Unternehmen. Es ist ein Anbieter von Analysedatenplattformen, Anwendungen und anderen damit verbundenen Dienstleistungen. Das Unternehmen entwickelt ein Produkt, um Daten aus verschiedenen Quellen zu konsolidieren und fรผr die Analyse verfรผgbar zu machen.
Geschichte von Teradata
Teradata war ein Geschรคftsbereich der NCR Corporation. Das Unternehmen wurde 1979 gegrรผndet, trennte sich jedoch im Oktober 2007 von NCR. Michael Koehler wurde der erste CEO von Teradata.
Meilensteine โโder Teradata Corporation:
- 1979 โ Teradata wurde gegrรผndet
- 1984 โ Verรถffentlichung des ersten Datenbankcomputers DBC/1012
- 1986 โ Das Fortune-Magazin erklรคrt Teradata zum โProdukt des Jahresโ
- 1999 โ Grรถรte mit Teradata erstellte Datenbank mit 130 Terabyte
- 2002 โ Verรถffentlichung der Teradata V2R5-Version mit Komprimierung und primรคrer Partitionierung
- 2006 โ Einfรผhrung der Teradata Master Data Management-Lรถsung
- 2008 โ Teradata 13.0 mit Active Data Warehousing verรถffentlicht
- 2011 โ รbernahme von Teradata Aster und Einstieg in den Bereich Advanced Analytics
- 2012 โ Teradata 14.0 eingefรผhrt
- 2014 โ Teradata 15.0 eingefรผhrt
- 2015 โ Teradata kauft die Apps-Marketingplattform Appoxee
- 2016 โ Terada schlieรt sich Big Data an
- 2017 โ Teradata รผbernimmt StackIQ aus San Diego
Warum Teradata?
- Teradata bietet ein umfassendes Servicepaket mit Schwerpunkt auf Data Warehousing
- Das System basiert auf einer offenen Architektur. Wenn also schnellere Gerรคte verfรผgbar werden, kรถnnen diese in die bereits vorhandene Architektur integriert werden.
- Teradata unterstรผtzt mehr als 50 Petabyte an Daten.
- Einzelbetriebsansicht fรผr ein groรes Teradata-Mehrknotensystem mit Service Workstation
- Kompatibel mit einer Vielzahl von BI-Tool um Daten abzurufen.
- Es kann als zentraler Kontrollpunkt fรผr den DBA fungieren, um das zu verwalten Datenbank.
- Hohe Leistung, vielfรคltige Abfragen, datenbankinterne Analysen und ausgefeiltes Workload-Management
- Mit Teradata kรถnnen Sie dieselben Daten fรผr mehrere Bereitstellungsoptionen abrufen
Als Nรคchstes lernen wir in diesem Teradata-Tutorial die Funktionen von Teradata kennen.
Funktionen von Teradata SQL
Teradata bietet die folgenden leistungsstarken Funktionen:
- Lineare Skalierbarkeit: Bietet lineare Skalierbarkeit bei der Verarbeitung groรer Datenmengen durch Hinzufรผgen von Knoten, um die Leistung des Systems zu steigern.
- Unbegrenzte Parallelitรคt: Teradata basiert auf MPP (Massively Parallel Processing). Archi(Textur). Es ist also von Anfang an auf Parallelitรคt ausgelegt. Es kann eine groรe Aufgabe in kleinere Aufgaben aufteilen und diese parallel ausfรผhren
- Ausgereifter Optimierer: Teradata Optimizer kann bis zu 64 Verknรผpfungen in einer Abfrage verarbeiten.
- Niedrige Gesamtbetriebskosten: Tera-Daten haben niedrige Gesamtbetriebskosten. Es ist einfach einzurichten, zu warten und zu verwalten.
- Dienstprogramme laden und entladen: Teradata bietet Lade- und Entladeprogramme zum Verschieben von Daten in das/aus dem Teradata-System.
- Konnektivitรคt: Dieses MPP-System kann mit kanalgebundenen Systemen wie einem Mainframe oder netzwerkgebundenen Systemen verbunden werden.
- SQL: Teradata unterstรผtzt SQL um mit den in Tabellen gespeicherten Daten zu interagieren. Es bietet seine Erweiterung.
- Robuste Dienstprogramme: Teradata bietet robuste Dienstprogramme zum Importieren/Exportieren von Daten aus/in Teradata-Systeme wie FastExport, FastLoad, MultiLoad und TPT.
- Automatische Verteilung: Teradata kann die Daten automatisch und ohne manuellen Eingriff auf die Festplatten verteilen.
Als nรคchstes lernen wir in diesem Teradata SQL-Tutorial etwas รผber Teradata ArchiStruktur.
Teradata Architektur
Die Teradata-Architektur ist eine Massively Parallel Processing ArchiStruktur.
Drei wichtige Komponenten von Teradata sind:
- Parsing-Engine
- BYNET
- Zugriffsmodulprozessoren (AMPs)
Teradatenspeicher Architecture-Datenbank ArchiStrukturdiagramm:

Teradatenspeicher Architektur
Parsing-Engine:
Die Parsing Engine analysiert die Abfragen und bereitet den Ausfรผhrungsplan vor. Sie verwaltet Sitzungen fรผr Benutzer. Sie optimiert und sendet eine Anfrage an die Benutzer.
Wenn der Client also Abfragen zum Einfรผgen von Datensรคtzen ausfรผhrt, sendet die Parsing Engine die Datensรคtze an die Message Passing-Schicht. Message Passing Layer oder BYNET ist eine Software- und Hardwarekomponente. Es bietet Netzwerkfรคhigkeit. Auรerdem werden die Datensรคtze abgerufen und die Zeile an den Ziel-AMP gesendet.
AMPERE:
AMP steht fรผr Access Module Processor. Es speichert Datensรคtze auf diesen Festplatten. AMP fรผhrt folgende Aktivitรคten durch:
- Verwaltet einen Teil der Datenbank
- Verwaltet einen Teil jeder Tabelle
- Fรผhren Sie alle mit der Generierung des Ergebnissatzes verbundenen Aufgaben aus, z. B. Sortieren, Aggregation und Verknรผpfung
- Fรผhren Sie die Sperr- und Speicherplatzverwaltung durch
Teradata-Abruf Architektur
Wenn der Client Abfragen zum Abrufen von Datensรคtzen ausfรผhrt, sendet die Parsing-Engine eine Anfrage an BYNET. Anschlieรend sendet BYNET die Abrufanfrage an die entsprechenden AMPs.
AMPs durchsuchen parallel ihre Festplatten, erkennen die erforderlichen Datensรคtze und senden sie an BYNET. BYNET sendet die Datensรคtze an die Parsing Engine, die wiederum an den Client gesendet wird.
Als nรคchstes lernen wir in diesem Teradata-Datenbank-Tutorial etwas รผber Teradata-SQL-Befehle.
Arten von Teradata SQL-Befehlen
Die Teradata-Datenbank unterstรผtzt die folgenden grundlegenden SQL-Befehle:
- DDL-Befehle (Data Definition Language).
- DCL-Befehle (Data Control Language).
- DML-Befehle (Data Manipulation Language).
Befehle der Datendefinitionssprache
| COMMAND | Beschreibung |
|---|---|
| CREATE | Erstellt eine neue Datenbank, Tabelle, einen neuen Benutzer usw. |
| DROP | Entfernt eine neue Datenbank, Tabelle, einen neuen Benutzer usw. |
| ALTER | รndert eine Tabelle, Spalte, einen Trigger usw. |
| รNDERN | รndert eine Datenbank oder Benutzerdefinition |
| UMBENENNEN | รndert Namen von Tabellen, Ansichten, Makros usw. |
Befehle der Datenkontrollsprache
| COMMAND | Beschreibung |
|---|---|
| GEWรHRUNG/WIDERRUFEN | Wird verwendet, um die Berechtigungen eines Benutzers fรผr ein Objekt zu steuern |
| ANMELDUNG GEWรHREN/ANMELDUNG WIDERRUFEN | Wird zur Steuerung der Anmeldeberechtigungen fรผr einen Host oder eine Hostgruppe verwendet |
| GEBEN | Wird verwendet, um ein Datenbankobjekt einem anderen Datenbankobjekt zuzuweisen |
Befehle der Teradata Database SQL Data Manipulation Language
| COMMAND | Beschreibung |
|---|---|
| LรSCHEN | Entfernt eine Zeile aus der Tabelle |
| ECHO | Wird verwendet, um eine Zeichenfolge oder einen Befehl an den Client zurรผckzugeben |
| KONTROLLPUNKT | Definiert einen Wiederherstellungspunkt im Journal, der spรคter zum Wiederherstellen des Tabelleninhalts verwendet werden kann |
| SELECT | Wird verwendet, um bestimmte Zeilendaten in Tabellenform zurรผckzugeben |
| AKTUALISIEREN | รndert Daten in einer oder mehreren Zeilen einer Tabelle |
Anwendungen der Teradata-Datenbank
Im Folgenden sind die beliebten Teradata-Anwendungen aufgefรผhrt:
- Kundendatenmanagement: Trรคgt dazu bei, langfristige Kundenbeziehungen aufrechtzuerhalten.
- Stammdatenverwaltung: Hilft bei der Entwicklung einer Umgebung, in der Stammdaten verwendet, synchronisiert und gespeichert werden kรถnnen.
- Finanz- und Leistungsmanagement: Hilft Unternehmen dabei, die Geschwindigkeit und Qualitรคt der Finanzberichterstattung zu verbessern. Es reduziert die Kosten fรผr die Finanzinfrastruktur und verwaltet die Unternehmensleistung proaktiv.
- Leitung der Lieferkette: Verbessern Sie die Ablรคufe in der Lieferkette, um den Kundenservice zu verbessern, Durchlaufzeiten zu verkรผrzen und die Lagerbestรคnde zu senken.
- Nachfragekettenmanagement: Trรคgt dazu bei, den Kundenservice und den Umsatz zu steigern. Es hilft Unternehmen auch dabei, die Nachfrage nach ihren Ladenartikeln genau vorherzusagen.
Als nรคchstes lernen wir in diesem Teradata-Tutorial fรผr Anfรคnger den Unterschied zwischen Teradata und anderen kennen RDBMS.
Unterschied zwischen Teradata und anderen RDBMS
| Parameter | TERA-DATEN | RDBMS |
|---|---|---|
| Architekturen | Folgt Shared Nothing ArchiStruktur. | Alles geteilt und Ressourcenkonflikte zugelassen. |
| Prozesse | MIPS [Millionen Anweisungen/Sek.] | KIPS [Tausende Institutionen/Sek.] |
| Indizes | Bessere Verteilung und Abruf | Bietet nur FASI-Abruf |
| Parallelitรคt | Unterstรผtzt bedingungslose Parallelitรคt. | Parallelitรคt ist bedingt und unvorhersehbar |
| Groรe Ladung | Teradata ermรถglicht Massenladen. | Ermรถglicht nur begrenztes Massenladen. |
| Skalierbarkeit | Lineare Skalierbarkeit mit einer Steigung von eins | Skalierbarkeit bei sinkenden Ertrรคgen |
| Datenbankpuffer | Ein einziger Datenbankpuffer, der von allen UoPs verwendet wird. (Eine Einheit der Parallelitรคt). Ein einziger Datenspeicher, auf den alle UoPs zugreifen | Query Controller sendet Funktionen an UoPs, die Eigentรผmer der Daten sind |
| Lรคden | Es speichert TERA BYTES[BillIonen von Reihen] | GIGA BYTES[Millionen Zeilen] |
MPP vs. SMP
| MPP | SMP |
|---|---|
| MPP โ Massively Parallel Processing. Es handelt sich um ein Computersystem, das mit vielen unabhรคngigen Recheneinheiten oder ganzen Mikroprozessoren verbunden ist, die parallel laufen. | Symmetrisches Multi-Processing. In einem SMP-Verarbeitungssystem teilen sich die CPUs denselben Speicher. Daher kann sich Code, der in einem System ausgefรผhrt wird, auf den von einem anderen System verwendeten Speicher auswirken. |
| Datenbanken kรถnnen durch das Hinzufรผgen neuer CPUs erweitert werden. | SMP-Datenbanken verwenden im Allgemeinen eine CPU, um Datenbanksuchen durchzufรผhren. |
| In einer MPP-Umgebung wird die Leistung verbessert, da keine Ressourcen zwischen physischen Computern geteilt werden mรผssen. | Die Arbeitslast fรผr einen parallelen Job wird auf die Prozessoren im System verteilt. |
| Die Leistung eines Massive-Parallelverarbeitungssystems ist linear. Sie wird jedoch proportional zur Anzahl der Knoten zunehmen. | SMP-Datenbanken kรถnnen auf mehreren Servern laufen. Allerdings wird eine andere Ressource geteilt. |
Zusammenfassung
- Teradata-Bedeutung: Teradata ist eine Open-Source-Lรถsung Datenbankverwaltungssystem fรผr die Entwicklung umfangreicher Data-Warehousing-Anwendungen.
- Teradata war ein Geschรคftsbereich der NCR Corporation. Es wurde 1979 gegrรผndet, trennte sich jedoch im Oktober 2007 von NCR
- Teradata bietet ein umfassendes Servicepaket mit Schwerpunkt auf Data Warehousing
- Teradata bietet lineare Skalierbarkeit bei der Verarbeitung groรer Datenmengen durch das Hinzufรผgen von Knoten, um die Leistung des Systems zu steigern.
- Drei wichtige Komponenten von Teradata sind 1) Parsing Engine 2) MPP 3) Access Module Processors (AMPs)
- Teradata bietet eine komplette Produktpalette, um die Data Warehousing- und ETL-Anforderungen jedes Unternehmens zu erfรผllen
- Teradata-Anwendung, die hauptsรคchlich fรผr Supply Chain Management, Master Data Management, Demand Chain Management usw. verwendet wird.
