Teradata oktatóanyag: Mi az a Teradata SQL? Adatbázis Architectúra

Mi az a Teradata?

Teradata egy nyílt forráskódú adatbázis-kezelő rendszer nagyméretű adattárház-alkalmazások fejlesztésére. Ez az eszköz több adattárház-művelethez nyújt egyidejű támogatást a párhuzamosság elvének használatával. A Teradata egy masszívan nyílt feldolgozórendszer, amely támogatja a Unix/Linux/Windows szerver platformok.

A Teradata szoftvert a Teradata Corporation fejlesztette ki, amely egy amerikai IT-cég. Analitikai adatplatformok, alkalmazások és egyéb kapcsolódó szolgáltatások szállítója. A cég olyan terméket fejleszt ki, amely a különböző forrásokból származó adatokat konszolidálja és elemzés céljából elérhetővé teszi.

A Teradata története

A Teradata az NCR Corporation részlege volt. 1979-ben alapították, de 2007 októberében elvált az NCR-től. Michael Koehler lett a Teradata első vezérigazgatója.

A Teradata Corporation mérföldkövei:

  • 1979 – A Teradata bejegyzése
  • 1984 – Az első DBC/1012 adatbázis-számítógép kiadása
  • 1986 – A Fortune magazin a Teradatát az év termékének nyilvánította
  • 1999 – A legnagyobb Teradata használatával épített adatbázis 130 terabájttal
  • 2002 – A Teradata V2R5 verzió kiadása tömörítéssel és elsődleges partícióval
  • 2006 – A Teradata Master Data Management megoldás bevezetése
  • 2008 – Megjelent a Teradata 13.0 Active Data Warehousing szolgáltatással
  • 2011 – Felvásárolja a Teradata Astert, és belép az Advanced Analytics Space-be
  • 2012 – A Teradata 14.0 bevezetése
  • 2014 – A Teradata 15.0 bevezetése
  • 2015 – A Teradata megvásárolja az Apps Marketing Platform Appoxee-t
  • 2016 – A Terada összefog a Big Data területén
  • 2017 – A Teradata felvásárolja a San Diego-i StackIQ-t

Miért a Teradata?

  • A Teradata teljes körű szolgáltatáscsomagot kínál, amely a Adattárolás
  • A rendszer nyílt architektúrára épül. Így amikor bármilyen gyorsabb eszköz elérhetővé válik, beépíthető a már felépített architektúrába.
  • A Teradata több mint 50 petabájt adatot támogat.
  • Egyműveletes nézet egy nagy Teradata többcsomópontos rendszerhez Service Workstation használatával
  • Kompatibilis a széles választékkal BI eszköz adatok lekérésére.
  • Egyetlen vezérlési pontként működhet a DBA számára, hogy kezelje a adatbázis.
  • Nagy teljesítmény, változatos lekérdezések, adatbázison belüli elemzés és kifinomult terheléskezelés
  • A Teradata lehetővé teszi, hogy ugyanazokat az adatokat kapja meg több telepítési lehetőségről

Ebben a Teradata oktatóanyagban a következő lépésben a Teradata szolgáltatásairól fogunk tanulni.

A Teradata SQL jellemzői

A Teradata a következő hatékony funkciókat kínálja:

  • Lineáris skálázhatóság: Lineáris méretezhetőséget kínál nagy mennyiségű adat kezelésekor a rendszer teljesítményének növelése érdekében csomópontok hozzáadásával.
  • Korlátlan párhuzamosság: A Teradata az MPP-n (Massively Parallel Processing) alapul Architectúra). Tehát a kezdetektől párhuzamosnak tervezték. Egy nagy feladatot kisebb feladatokra tud felosztani és párhuzamosan futtatni
  • Felnőtt optimalizáló: A Teradata Optimizer legfeljebb 64 csatlakozást tud kezelni egy lekérdezésben.
  • Alacsony TCO: A Tera adatoknak alacsony a teljes birtoklási költsége. Könnyen beállítható, karbantartható és felügyelhető.
  • Be- és kiürítési segédprogramok: A Teradata be- és kiürítési segédprogramokat biztosít az adatok átviteléhez a Teradata rendszerbe, illetve onnan.
  • Csatlakoztathatóság: Ez az MPP rendszer csatlakozhat csatornához csatlakoztatott rendszerekhez, például nagyszámítógéphez vagy hálózathoz csatlakoztatott rendszerekhez.
  • SQL: A Teradata támogatja SQL a táblázatokban tárolt adatokkal való interakcióhoz. Kiterjesztését biztosítja.
  • Robusztus segédprogramok: A Teradata robusztus segédprogramokat biztosít adatok importálására/exportálására Teradata rendszerekről, például FastExport, FastLoad, MultiLoad és TPT.
  • Automatikus elosztás: Teradata kézi beavatkozás nélkül automatikusan eloszthatja az adatokat a lemezekre.

Ebben a Teradata SQL oktatóanyagban a következő lépésben a Teradatával fogunk megismerkedni Architectúra.

Teradata Architectúra

A Teradata architektúra egy masszívan párhuzamos feldolgozás Architectúra.

A Teradata három fontos összetevője:

  • Elemző motor
  • BYNET
  • Hozzáférési modul-processzorok (AMP)

Teradata tárolás Architecture adatbázis Architectúra diagram:

Teradata Architectúra
Teradata Architecture diagram

Teradata tárolás Architectúra

Elemző motor:

Az elemző motor elemzi a lekérdezéseket és elkészíti a végrehajtási tervet. Kezeli a felhasználók munkameneteit. Optimalizálja és kérést küld a felhasználóknak.

Tehát amikor az ügyfél lekérdezéseket hajt végre a rekordok beszúrására, az Elemző motor elküldi a rekordokat az Üzenetátadási rétegnek. Az üzenettovábbítási réteg vagy a BYNET egy szoftver- és hardverkomponens. Hálózati lehetőséget kínál. Ezenkívül lekéri a rekordokat, és elküldi a sort a cél AMP-nek.

AMP:

Az AMP az Access Module Processor rövidítése. Ezeken a lemezeken tárolja a rekordokat. Az AMP a következő tevékenységeket végzi:

  • Kezeli az adatbázis egy részét
  • Minden tábla egy részét kezeli
  • Végezze el az eredménykészlet generálásával kapcsolatos összes feladatot, például rendezést, összesítést és csatlakozást
  • Végezze el a zár- és területkezelést

Teradata visszakeresés Architectúra

Amikor az ügyfél lekérdezéseket futtat a rekordok lekérésére, az elemző motor kérést küld a BYNET-nek. Ezután a BYNET elküldi a visszakeresési kérelmet a megfelelő AMP-knek.

Az AMP-k párhuzamosan keresnek a lemezeiken, felismerik a szükséges rekordokat, és elküldik a BYNET-nek. A BYNET elküldi a rekordokat az Elemző motornak, amely viszont elküldi az ügyfélnek.

Ebben a Teradata Database oktatóanyagban a következő lépésben a Teradata SQL-parancsokról fogunk tanulni.

A Teradata SQL parancsok típusai

A Teradata Database a következő alapvető SQL-parancsokat támogatja:

  1. Data Definition Language (DDL) parancsok
  2. Data Control Language (DCL) parancsok
  3. Data Manipulation Language (DML) parancsok

Adatdefiníciós nyelvi parancsok

COMMAND Leírás
TEREMT Létrehoz egy új adatbázist, táblát, felhasználót stb.
DROP Eltávolít egy új adatbázist, táblát, felhasználót stb.
VÁLTOZTAT Megváltoztat egy táblázatot, oszlopot, triggert stb.
MÓDOSÍT Módosítja az adatbázist vagy a felhasználói definíciót
ÁTNEVEZÉS Megváltoztatja a táblák, nézetek, makrók stb. nevét.

Data Control Language parancsok

COMMAND Leírás
GRANT/REVOVE Egy objektum felhasználói jogosultságának szabályozására szolgál
BEJELENTKEZÉS MEGADÁSA/BEJELENTKEZÉS VISSZAVONÁSA Egy gazdagép vagy gazdagépcsoport bejelentkezési jogosultságának vezérlésére szolgál
ADNI Egy adatbázis-objektum egy másik adatbázis-objektumnak való átadására szolgál

Teradata Database SQL Data Manipulation Language parancsok

COMMAND Leírás
DELETE Eltávolít egy sort a táblázatból
ECHO Egy karakterlánc vagy parancs visszaadására szolgál az ügyfélnek
ELLENŐRZŐ PONT Meghatároz egy helyreállítási pontot a naplóban, amely később felhasználható a tábla tartalmának visszaállítására
SELECT Egy adott sor adatainak visszaadására szolgál táblázat formában
UPDATE Módosítja a táblázat egy vagy több sorának adatait

A Teradata adatbázis alkalmazásai

Íme a népszerű Teradata alkalmazások:

  • Ügyféladatok kezelése: Segíti a hosszú távú kapcsolatok fenntartását az ügyfelekkel.
  • Törzsadat-kezelés: Segít olyan környezet kialakításában, ahol a törzsadatok használhatók, szinkronizálhatók és tárolhatók.
  • Pénzügy és teljesítménymenedzsment: Segíti a szervezetet a pénzügyi jelentéskészítés sebességének és minőségének javításában. Csökkenti a pénzügyi infrastruktúra költségeit, és proaktívan kezeli a vállalati teljesítményt.
  • Ellátási lánc menedzsment: Javítsa az ellátási lánc működését, ami javítja az ügyfélszolgálatot, csökkenti a ciklusidőket és csökkenti a készleteket.
  • Keresleti lánc menedzsment: Segít növelni az ügyfélszolgálati színvonalat és az értékesítést. Segít a vállalatoknak abban is, hogy pontosan előre jelezzék a bolti cikkek iránti keresletet.

A következő ebben a Teradata kezdőknek oktatóanyagában megtudjuk, mi a különbség a Teradata és a többi között RDBMS.

A Teradata és a többi RDBMS közötti különbség

Vizsgált paraméter TERA ADATOK RDBMS
Architectúrák Megosztott semmit követ Architectúra. Megosztott mindent, és lehetővé teszi az erőforrásokkal való versengést.
folyamatok MIPS [Milliónyi utasítás/mp] KIPS [Több ezer intézmény/mp]
Indexek Jobb terjesztés és visszakeresés Csak FASI visszakeresést kínál
Párhuzamosság Támogatja a feltétel nélküli párhuzamosságot. A párhuzamosság feltételes és kiszámíthatatlan
Tömeges terhelés A Teradata lehetővé teszi a tömeges terhelést. Csak korlátozott ömlesztett terhelést tesz lehetővé.
Bővíthetőség Lineáris skálázhatóság egyes meredekséggel Méretezhetőség csökkenő megtérüléssel
Adatbázis puffer Egyetlen adatbázis-puffer, amelyet minden UoP használ. (A párhuzamosság egysége). Egyetlen adattár, amelyhez az összes UoP hozzáfér A Query Controller funkciókat szállít az adatokat birtokló UoP-knek
üzletek TERA BYTES[Billsorok ionjai] GIGA BYTES[Sorok milliói]

MPP vs. SMP

MPP SMP
MPP – Massively Parallel Processing. Ez egy számítógépes rendszer, amely számos független aritmetikai egységhez vagy teljes mikroprocesszorhoz kapcsolódik, amelyek párhuzamosan futnak. Szimmetrikus többszörös feldolgozás. Az SMP feldolgozó rendszerekben a CPU-k ugyanazon a memórián osztoznak, és ennek eredményeként az egyik rendszerben futó kód hatással lehet a másik rendszer által használt memóriára.
Az adatbázisok bővíthetők új CPU-k hozzáadásával. Az SMP adatbázisok általában egy CPU-t használnak az adatbázis-keresések végrehajtására.
MPP-környezetben a teljesítmény javul, mivel nem kell erőforrásokat megosztani a fizikai számítógépek között. A párhuzamos jobok terhelése megoszlik a rendszer processzorai között.
A Massive párhuzamos feldolgozó rendszer teljesítménye lineáris. Ez azonban a csomópontok számával arányosan fog növekedni. Az SMP adatbázisok több szerveren is futhatnak. Azonban megoszt egy másik erőforrást.

Összegzésként

  • A Teradata jelentése: A Teradata nyílt forráskódú Adatbázis kezelő rendszer nagyszabású adattárház alkalmazások fejlesztésére.
  • A Teradata az NCR Corporation részlege volt. 1979-ben alapították, de 2007 októberében kivált az NCR-től
  • A Teradata teljes körű szolgáltatáscsomagot kínál, amely az adattárházra összpontosít
  • A Teradata a rendszer teljesítményének növelése érdekében csomópontok hozzáadásával lineáris skálázhatóságot kínál nagy mennyiségű adat kezelésekor.
  • A Teradata három fontos összetevője: 1) Elemző motor 2) MPP 3) Access Module Processors (AMP)
  • A Teradata a termékcsomag teljes skáláját kínálja bármely szervezet adattárház- és ETL-szükségleteinek kielégítésére
  • A Teradata alkalmazás elsősorban az ellátási lánc kezeléséhez, a törzsadatkezeléshez, a keresleti lánc kezeléséhez stb.

Foglald össze ezt a bejegyzést a következőképpen: