Samouczek Teradata: Co to jest Teradata SQL? Baza danych Architektura
Co to jest Teradata?
Teradane jest systemem zarzฤ dzania bazฤ danych typu open source do tworzenia aplikacji do magazynowania danych na duลผฤ skalฤ. To narzฤdzie zapewnia obsลugฤ wielu operacji magazynowania danych jednoczeลnie, wykorzystujฤ c koncepcjฤ paralelizmu. Teradata jest masowo otwartym systemem przetwarzania, ktรณry obsลuguje systemy Unix/Linux/Windows platformy serwerowe.
Oprogramowanie Teradata zostaลo opracowane przez Teradata Corporation, amerykaลskฤ firmฤ informatycznฤ . Jest dostawcฤ platform danych analitycznych, aplikacji i innych powiฤ zanych usลug. Firma rozwija produkt pozwalajฤ cy konsolidowaฤ dane z rรณลผnych ลบrรณdeล i udostฤpniaฤ je do analizy.
Historia Teradaty
Teradata byลa oddziaลem NCR Corporation. Zostaลa zaลoลผona w 1979 r., ale oddzieliลa siฤ od NCR w paลบdzierniku 2007 r. Michael Koehler zostaล pierwszym dyrektorem generalnym Teradata.
Kamienie milowe Teradata Corporation:
- 1979 โ zarejestrowano firmฤ Teradata
- 1984 โ Wypuszczenie pierwszego komputera bazodanowego DBC/1012
- 1986 โ Magazyn Fortune uznaล Teradata za โProdukt Rokuโ
- 1999 โ Najwiฤksza baza danych zbudowana przy uลผyciu Teradaty o wielkoลci 130 terabajtรณw
- 2002 โ wydanie wersji Teradata V2R5 z kompresjฤ i partycjฤ podstawowฤ
- 2006 โ Wprowadzenie rozwiฤ zania Teradata Master Data Management
- 2008 โ wypuszczenie Teradata 13.0 z Active Data Warehousing
- 2011 โ nabywa Teradata Aster i zagลฤbia siฤ w przestrzeล Advanced Analytics
- 2012 โ wprowadzenie Teradata 14.0
- 2014 โ wprowadzenie Teradata 15.0
- 2015 โ Teradata kupuje platformฤ marketingowฤ aplikacji Appoxee
- 2016- Terada ลฤ czy siลy z Big Data
- 2017 โ Teradata przejmuje StackIQ w San Diego
Dlaczego Teradata?
- Teradata oferuje peลny pakiet usลug, ktรณry koncentruje siฤ na Magazyn danych
- System jest zbudowany na otwartej architekturze. Wiฤc kiedykolwiek jakieล szybsze urzฤ dzenia sฤ dostฤpne, moลผna je wลฤ czyฤ do juลผ zbudowanej architektury.
- Teradata obsลuguje ponad 50 petabajtรณw danych.
- Pojedynczy widok operacyjny dla duลผego systemu wielowฤzลowego Teradata przy uลผyciu Service Workstation
- Kompatybilny z szerokฤ gamฤ Narzฤdzie BI do pobrania danych.
- Moลผe dziaลaฤ jako pojedynczy punkt kontroli dla administratora danych w celu zarzฤ dzania Baza danych.
- Wysoka wydajnoลฤ, rรณลผnorodne zapytania, analityka w bazie danych i zaawansowane zarzฤ dzanie obciฤ ลผeniem
- Teradata umoลผliwia uzyskanie tych samych danych przy wielu opcjach wdroลผenia
W dalszej czฤลci tego samouczka Teradata dowiemy siฤ o funkcjach Teradata.
Funkcje Teradata SQL
Teradata oferuje nastฤpujฤ ce zaawansowane funkcje:
- Skalowalnoลฤ liniowa: Oferuje skalowalnoลฤ liniowฤ w przypadku duลผych iloลci danych poprzez dodanie wฤzลรณw w celu zwiฤkszenia wydajnoลci systemu.
- Nieograniczona rรณwnolegลoลฤ: Teradata opiera siฤ na MPP (Massively Parallel Processing Architektura). Dlatego od poczฤ tku zaprojektowano go rรณwnolegle. Potrafi podzieliฤ duลผe zadanie na mniejsze zadania i wykonywaฤ je rรณwnolegle
- Dojrzaลy optymalizator: Teradata Optimizer moลผe obsลuลผyฤ do 64 zลฤ czeล w zapytaniu.
- Niski caลkowity koszt posiadania: Tera Data charakteryzuje siฤ niskim caลkowitym kosztem posiadania. Jest ลatwy w konfiguracji, utrzymaniu i administrowaniu.
- Zaลaduj i rozลaduj narzฤdzia: Teradata zapewnia narzฤdzia do ลadowania i rozลadowywania umoลผliwiajฤ ce przenoszenie danych do/z systemu Teradata.
- ลฤ cznoลฤ: Ten system MPP moลผna podลฤ czyฤ do systemรณw podลฤ czonych do kanaลu, takich jak komputery typu mainframe lub systemy podลฤ czone do sieci.
- SQL: Obsลuguje Teradata SQL do interakcji z danymi przechowywanymi w tabelach. Zapewnia jego rozszerzenie.
- Solidne narzฤdzia: Teradata zapewnia niezawodne narzฤdzia do importowania/eksportowania danych z/do systemรณw Teradata, takich jak FastExport, FastLoad, MultiLoad i TPT.
- Automatyczna dystrybucja: Teradane moลผe automatycznie dystrybuowaฤ dane na dyski, bez koniecznoลci rฤcznej interwencji.
W dalszej czฤลci tego samouczka Teradata SQL dowiemy siฤ o Teradata Architektura.
Teradane Architektura
Architektura Teradata to masowo rรณwnolegลa architektura przetwarzania Architektura.
Trzy waลผne komponenty Teradata to:
- Silnik analizujฤ cy
- BYNET
- Procesory moduลรณw dostฤpowych (AMP)
Pamiฤฤ Teradanych ArchiBaza danych technologii Archischemat budowy:

Pamiฤฤ Teradanych Architektura
Silnik analizujฤ cy:
Parsing Engine analizuje zapytania i przygotowuje plan wykonania. Zarzฤ dza sesjami dla uลผytkownikรณw. Optymalizuje i wysyลa ลผฤ danie do uลผytkownikรณw.
Tak wiฤc, gdy klient wykonuje zapytania o wstawienie rekordรณw, silnik analizujฤ cy wysyลa rekordy do warstwy przekazywania komunikatรณw. Warstwa przekazujฤ ca komunikaty, czyli BYNET, to komponent oprogramowania i sprzฤtu. Oferuje moลผliwoลci pracy w sieci. Pobiera rรณwnieลผ rekordy i wysyลa wiersz do docelowego AMP.
AMP:
AMP oznacza Access Module Processor. Przechowuje rekordy na tych dyskach. AMP wykonuje nastฤpujฤ ce czynnoลci:
- Zarzฤ dza czฤลciฤ bazy danych
- Zarzฤ dza czฤลciฤ kaลผdej tabeli
- Wykonuj wszystkie zadania zwiฤ zane z generowaniem zestawu wynikรณw, takie jak sortowanie, agregacja i ลฤ czenie
- Zarzฤ dzaj blokadami i przestrzeniฤ
Odzyskiwanie Teradanych Architektura
Gdy klient uruchamia zapytania w celu pobrania rekordรณw, aparat analizujฤ cy wysyลa ลผฤ danie do BYNET. Nastฤpnie BYNET wysyลa ลผฤ danie pobrania do odpowiednich AMP.
AMP przeszukujฤ swoje dyski rรณwnolegle, rozpoznajฤ wymagane rekordy i wysyลajฤ je do BYNET. BYNET wysyลa rekordy do silnika analizujฤ cego, ktรณry z kolei zostanie wysลany do klienta.
W dalszej czฤลci tego samouczka dotyczฤ cego bazy danych Teradata dowiemy siฤ o poleceniach Teradata SQL.
Rodzaje poleceล Teradata SQL
Baza danych Teradata obsลuguje nastฤpujฤ ce podstawowe polecenia SQL:
- Polecenia jฤzyka definicji danych (DDL).
- Polecenia jฤzyka kontroli danych (DCL).
- Polecenia jฤzyka manipulacji danymi (DML).
Polecenia jฤzyka definicji danych
| COMMAND | OPIS |
|---|---|
| TWORZENIE | Tworzy nowฤ bazฤ danych, tabelฤ, uลผytkownika itp. |
| DROP | Usuwa nowฤ bazฤ danych, tabelฤ, uลผytkownika itp. |
| ZMIANA | Zmienia tabelฤ, kolumnฤ, wyzwalacz itp. |
| MODYFIKOWAฤ | Zmienia bazฤ danych lub definicjฤ uลผytkownika |
| PRZEMIANOWAฤ | Zmienia nazwy tabel, widokรณw, makr itp. |
Polecenia jฤzyka kontroli danych
| COMMAND | OPIS |
|---|---|
| PRZYZNAJ/ODWOลAJ | Sลuลผy do kontrolowania uprawnieล uลผytkownika do obiektu |
| PRZYZNAJ LOGOWANIE/ODWOลAJ LOGOWANIE | Sลuลผy do kontrolowania uprawnieล logowania do hosta lub grupy hostรณw |
| DAฤ | Sลuลผy do przekazywania obiektu bazy danych innemu obiektowi bazy danych |
Polecenia jฤzyka manipulacji danymi Teradata Database SQL
| COMMAND | OPIS |
|---|---|
| DELETE | Usuwa wiersz z tabeli |
| ECHO | Sลuลผy do wysyลania echa ciฤ gu lub polecenia do klienta |
| PUNKT KONTROLNY | Definiuje punkt odzyskiwania w dzienniku, ktรณry moลผna pรณลบniej wykorzystaฤ do przywrรณcenia zawartoลci tabeli |
| SELECT | Sลuลผy do zwracania okreลlonych danych wiersza w formie tabeli |
| Aktualizacja | Modyfikuje dane w jednym lub wiฤkszej liczbie wierszy tabeli |
Zastosowania bazy danych Teradata
Poniลผej przedstawiono popularne aplikacje Teradata:
- Zarzฤ dzanie danymi klientรณw: Pomaga utrzymaฤ dลugotrwaลe relacje z klientami.
- Zarzฤ dzanie danymi podstawowymi: Pomaga w stworzeniu ลrodowiska, w ktรณrym dane podstawowe mogฤ byฤ wykorzystywane, synchronizowane i przechowywane.
- Zarzฤ dzanie finansami i wynikami: Pomaga organizacji poprawiฤ szybkoลฤ i jakoลฤ raportowania finansowego. Zmniejsza koszty infrastruktury finansowej i aktywnie zarzฤ dza wydajnoลciฤ przedsiฤbiorstwa.
- Zarzฤ dzanie ลaลcuchem dostaw: Usprawnij dziaลanie ลaลcucha dostaw, co przeลoลผy siฤ na lepszฤ obsลugฤ klienta, skrรณcenie czasu cykli i obniลผenie zapasรณw.
- Zarzฤ dzanie ลaลcuchem popytu: Pomaga zwiฤkszyฤ poziom obsลugi klienta i sprzedaลผy. Pomaga takลผe firmom dokลadnie przewidzieฤ popyt na produkty w ich sklepie.
W dalszej czฤลci tego samouczka Teradata dla poczฤ tkujฤ cych dowiemy siฤ o rรณลผnicy miฤdzy Teradata a innymi programami RDBMS.
Rรณลผnica miฤdzy Teradata a innymi RDBMS
| Parametr | DANE TERA | RDBMS |
|---|---|---|
| Archistruktury | Obserwuje Shared Nothing Architektura. | Udostฤpnij wszystko i umoลผliwia rywalizacjฤ o zasoby. |
| Procesy | MIPS [miliony instrukcji/s] | KIPS [tysiฤ ce instytucji/s] |
| Indeksy | Lepsza dystrybucja i odzyskiwanie | Oferuje tylko pobieranie FASI |
| Rรณwnolegลoลฤ | Obsลuguje bezwarunkowฤ rรณwnolegลoลฤ. | Rรณwnolegลoลฤ jest warunkowa i nieprzewidywalna |
| Obciฤ ลผenie zbiorcze | Teradata umoลผliwia ลadowanie masowe. | Umoลผliwia tylko ograniczone obciฤ ลผenie masowe. |
| Skalowalnoลฤ | Skalowalnoลฤ liniowa o nachyleniu jeden | Skalowalnoลฤ przy malejฤ cych zyskach |
| Bufor bazy danych | Pojedynczy bufor bazy danych uลผywany przez wszystkie UoP. (Jednostka paralelizmu). Pojedynczy magazyn danych dostฤpny dla wszystkich UoP. | Query Controller dostarcza funkcje do UoP, ktรณre sฤ wลaลcicielami danych |
| Sklepy | Przechowuje TERA BYTES [Billjony rzฤdรณw] | GIGA BYTES [Miliony wierszy] |
MPP kontra SMP
| MPP | SMP |
|---|---|
| MPP โ masowe przetwarzanie rรณwnolegลe. Jest to system komputerowy, ktรณry jest podลฤ czony do wielu niezaleลผnych jednostek arytmetycznych lub caลych mikroprocesorรณw, ktรณre dziaลajฤ rรณwnolegle. | Symetryczne przetwarzanie wieloprocesowe. W systemie przetwarzajฤ cym SMP procesory korzystajฤ z tej samej pamiฤci, w wyniku czego kod dziaลajฤ cy w jednym systemie moลผe wpลywaฤ na pamiฤฤ uลผywanฤ przez inny. |
| Bazy danych moลผna rozbudowywaฤ poprzez dodanie nowych procesorรณw. | Bazy danych SMP zazwyczaj korzystajฤ z jednego procesora do wykonywania przeszukiwaล baz danych. |
| W ลrodowisku MPP wydajnoลฤ jest lepsza, poniewaลผ ลผadne zasoby nie muszฤ byฤ wspรณลdzielone pomiฤdzy komputerami fizycznymi. | Obciฤ ลผenie zadania rรณwnolegลego jest rozkลadane na procesory w systemie. |
| Wydajnoลฤ ogromnego systemu przetwarzania rรณwnolegลego jest liniowa. Bฤdzie jednak wzrastaฤ proporcjonalnie do liczby wฤzลรณw. | Bazy danych SMP mogฤ dziaลaฤ na wielu serwerach. Jednak udostฤpni inny zasรณb. |
Podsumowanie
- Znaczenie Teradata: Teradata jest oprogramowaniem typu open source System zarzฤ dzania bazฤ danych do tworzenia wielkoskalowych aplikacji do przechowywania danych.
- Teradata byลa oddziaลem NCR Corporation. Zostaลa utworzona w 1979 r., ale oddzieliลa siฤ od NCR w paลบdzierniku 2007 r
- Teradata oferuje peลny pakiet usลug skupiajฤ cych siฤ na hurtowni danych
- Teradata oferuje skalowalnoลฤ liniowฤ w przypadku duลผych iloลci danych poprzez dodanie wฤzลรณw w celu zwiฤkszenia wydajnoลci systemu.
- Trzy waลผne komponenty Teradata to 1) silnik parsujฤ cy 2) MPP 3) procesory moduลรณw dostฤpowych (AMP)
- Teradata oferuje peลnฤ gamฤ produktรณw speลniajฤ cych potrzeby kaลผdej organizacji w zakresie hurtowni danych i ETL
- Aplikacja Teradata uลผywana gลรณwnie do zarzฤ dzania ลaลcuchem dostaw, zarzฤ dzania danymi podstawowymi, zarzฤ dzania ลaลcuchem popytu itp.
