Teradata-veiledning: Hva er Teradata SQL? Database Architecture
Hva er Teradata?
Teradata er et รฅpen kildekode-databasestyringssystem for utvikling av store datavarehusapplikasjoner. Dette verktรธyet gir stรธtte for flere datavarehusoperasjoner samtidig ved รฅ bruke konseptet parallellisme. Teradata er et massivt รฅpent behandlingssystem som stรธtter Unix/Linux/Windows serverplattformer.
Teradata-programvaren er utviklet av Teradata Corporation, som er et amerikansk IT-firma. Det er en leverandรธr av analysedataplattformer, applikasjoner og andre relaterte tjenester. Firmaet utvikler et produkt for รฅ konsolidere data fra ulike kilder og gjรธre dataene tilgjengelige for analyse.
Historien om Teradata
Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007. Michael Koehler ble den fรธrste administrerende direktรธren i Teradata.
Milepรฆler for Teradata Corporation:
- 1979 - Teradata ble innlemmet
- 1984 โ Utgivelse av fรธrste databasedatamaskin DBC/1012
- 1986 - Fortune magazine erklรฆrte Teradata som 'ร rets produkt'
- 1999 - Stรธrste database bygget med Teradata med 130 Terabyte
- 2002 - Teradata V2R5 versjonsutgivelse med komprimering og partisjonsprimรฆr
- 2006 โ Lansering av Teradata Master Data Management-lรธsning
- 2008 โ Teradata 13.0 utgitt med Active Data Warehousing
- 2011 โ Kjรธper Teradata Aster og stuper inn i Advanced Analytics Space
- 2012 โ Teradata 14.0 introdusert
- 2014 โ Teradata 15.0 introdusert
- 2015- Teradata kjรธper Apps Marketing Platform Appoxee
- 2016- Terada gรฅr sammen med Big data
- 2017- Teradata anskaffer San Diegos StackIQ
Hvorfor Teradata?
- Teradata tilbyr en komplett tjenestepakke som fokuserer pรฅ Datavarehus
- Systemet er bygget pรฅ รฅpen arkitektur. Sรฅ hver gang raskere enheter gjรธres tilgjengelige, kan de integreres i den allerede bygde arkitekturen.
- Teradata stรธtter 50+ petabyte med data.
- Enkeltoperasjonsvisning for et stort Teradata multi-node-system som bruker Service Workstation
- Kompatibel med et bredt utvalg av BI-verktรธy for รฅ hente data.
- Det kan fungere som et enkelt kontrollpunkt for DBA รฅ administrere Database.
- Hรธy ytelse, varierte sรธk, analyse i databasen og sofistikert hรฅndtering av arbeidsbelastning
- Teradata lar deg fรฅ de samme dataene pรฅ flere distribusjonsalternativer
Neste i denne Teradata-opplรฆringen vil vi lรฆre om funksjonene til Teradata.
Funksjoner i Teradata SQL
Teradata tilbyr fรธlgende kraftige funksjoner:
- Lineรฆr skalerbarhet: Tilbyr lineรฆr skalerbarhet ved hรฅndtering av store datavolumer ved รฅ legge til noder for รฅ รธke ytelsen til systemet.
- Ubegrenset parallellisme: Teradata er basert pรฅ MPP (Massively Parallel Processing). Architecture). Sรฅ den er designet for รฅ vรฆre parallell siden begynnelsen. Den kan dele opp en stor oppgave i mindre oppgaver og kjรธre dem parallelt
- Mature Optimizer: Teradata Optimizer kan hรฅndtere opptil 64 sammenfรธyninger i en spรธrring.
- Lav TCO: Tera-data har lave totale eierkostnader. Det er enkelt รฅ sette opp, vedlikeholde og administrere.
- Laste og losse verktรธy: Teradata tilbyr laste- og losseverktรธy for รฅ flytte data til/fra Teradata-systemet.
- Tilkobling: Dette MPP-systemet kan kobles til kanaltilkoblede systemer som en stormaskin eller nettverkstilkoblede systemer.
- SQL: Teradata stรธtter SQL รฅ samhandle med dataene som er lagret i tabeller. Det gir sin utvidelse.
- Robuste verktรธy: Teradata gir robuste verktรธy for รฅ importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
- Automatisk distribusjon: Teradata kan distribuere dataene til diskene automatisk uten manuell inngripen.
Neste i denne Teradata SQL-opplรฆringen vil vi lรฆre om Teradata Architecture.
Teradata Architecture
Teradata-arkitektur er en massivt parallell prosessering Architecture.
Tre viktige komponenter i Teradata er:
- Parsing Engine
- BYNET
- Access Module-prosessorer (AMP-er)
Teradata-lagring Architecture Database ArchiTecture Diagram:

Teradata-lagring Architecture
Parsing Engine:
Parsing Engine analyserer spรธrringene og forbereder utfรธrelsesplanen. Den administrerer รธkter for brukere. Den optimerer og sender en forespรธrsel til brukerne.
Sรฅ nรฅr klienten utfรธrer spรธrringer for รฅ sette inn poster, sender Parsing Engine postene til Message Passing-laget. Message passing layer eller BYNET er en programvare- og maskinvarekomponent. Den tilbyr nettverksmulighet. Den henter ogsรฅ postene og sender raden til mรฅl-AMP.
AMP:
AMP stรฅr for Access Module Processor. Den lagrer poster pรฅ disse diskene. AMP utfรธrer fรธlgende aktiviteter:
- Administrerer en del av databasen
- Administrerer en del av hvert bord
- Utfรธr alle oppgavene knyttet til รฅ generere resultatsett som sortering, aggregering og sammenfรธyning
- Utfรธr lรฅse- og plassadministrasjon
Henting av teradata Architecture
Nรฅr klienten kjรธrer spรธrringer for รฅ hente poster, sender Parsing-motoren en forespรธrsel til BYNET. Deretter sender BYNET gjenfinningsforespรธrselen til passende AMP-er.
AMP-er sรธker pรฅ diskene sine parallelt og gjenkjenner de nรธdvendige postene og sender dem til BYNET. BYNET sender postene til Parsing Engine, som igjen vil bli sendt til klienten.
Neste i denne Teradata Database-opplรฆringen vil vi lรฆre om Teradata SQL-kommandoer.
Typer Teradata SQL-kommandoer
Teradata Database stรธtter fรธlgende grunnleggende SQL-kommandoer:
- Data Definition Language (DDL) kommandoer
- Data Control Language (DCL) kommandoer
- Data Manipulation Language (DML) kommandoer
Data Definition Language-kommandoer
| KOMMANDO | Tekniske beskrivelser |
|---|---|
| SKAPE | Oppretter en ny database, tabell, bruker osv. |
| DROP | Fjerner en ny database, tabell, bruker osv. |
| ENDRE | Endrer en tabell, kolonne, utlรธser osv. |
| MODIFISER | Endrer en database eller brukerdefinisjon |
| RENAME | Endrer navn pรฅ tabeller, visninger, makroer osv. |
Sprรฅkkommandoer for datakontroll
| KOMMANDO | Tekniske beskrivelser |
|---|---|
| TILLEIE/TILLBAKE TILBAKE | Brukes til รฅ kontrollere rettigheter til en bruker pรฅ et objekt |
| GI Pร LOGGING/TILLBAKE Pร LOGGING | Brukes til รฅ kontrollere pรฅloggingsrettigheter til en vert eller vertsgruppe |
| GI | Brukes til รฅ gi et databaseobjekt til et annet databaseobjekt |
Teradata Database SQL Data Manipulation Language-kommandoer
| KOMMANDO | Tekniske beskrivelser |
|---|---|
| SLETT | Fjerner en rad fra tabellen |
| ECHO | Brukes til รฅ ekko en streng eller kommando til klienten |
| KONTROLLPUNKT | Definerer et gjenopprettingspunkt i journalen som kan brukes senere for รฅ gjenopprette tabellinnholdet |
| VELG | Brukes til รฅ returnere en spesifikk raddata i et tabellskjema |
| OPPDATERING | Endrer data i รฉn eller flere rader i en tabell |
Applikasjoner av Teradata-databasen
Fรธlgende er de populรฆre Teradata-applikasjonene:
- Kundedatabehandling: Bidrar til รฅ opprettholde langvarige relasjoner med kunder.
- Master Data Management: Bidrar til รฅ utvikle et miljรธ der masterdata kan brukes, synkroniseres og lagres.
- รkonomi og resultatstyring: Hjelper organisasjonen med รฅ forbedre hastigheten og kvaliteten pรฅ finansiell rapportering. Det reduserer kostnadene for finansinfrastruktur og administrerer bedriftsytelsen proaktivt.
- Supply Chain Management: Forbedre forsyningskjedeoperasjoner som bidrar til forbedret kundeservice, reduserte syklustider og lavere varelager.
- Etterspรธrselskjedestyring: Bidrar til รฅ รธke kundeservicenivรฅ og salg. Det hjelper ogsรฅ bedrifter med รฅ forutsi etterspรธrselen etter butikkvaren deres nรธyaktig.
Neste i denne Teradata for nybegynneropplรฆringen vil vi lรฆre om forskjellen mellom Teradata og andre RDBMS.
Forskjellen mellom Teradata og andre RDBMS
| Parameter | TERA DATA | RDBMS |
|---|---|---|
| Architectures | Fรธlger Shared Nothing Architecture. | Delte alt og tillater ressursstrid. |
| prosesser | MIPS [Millioner av instruksjoner/sek.] | KIPS [Tusenvis av institusjoner/sek] |
| Indekser | Bedre distribusjon og gjenfinning | Tilbyr kun FASI Retrieval |
| parallellitet | Stรธtter ubetinget parallellisme. | Parallelisme er betinget og uforutsigbar |
| Bulk belastning | Teradata tillater bulk belastning. | Tillater kun begrenset bulklast. |
| skalerbarhet | Lineรฆr skalerbarhet med en helning pรฅ รฉn | Skalerbarhet med avtagende avkastning |
| Databasebuffer | En enkelt databasebuffer brukt av alle UoP-er. (En enhet av parallellisme). Et enkelt datalager som alle UoP har tilgang til | Query Controller sender funksjoner til UoP-er som eier dataene |
| butikker | Den lagrer TERA BYTES[Billioner av rader] | GIGA BYTES[Millioner av rader] |
MPP vs. SMP
| MPP utvidelse | SMP |
|---|---|
| MPP โ Massively Parallell Processing. Det er datasystem som er koblet til mange uavhengige aritmetiske enheter eller hele mikroprosessorer som kjรธrer parallelt. | Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU-ene det samme minnet, og som et resultat kan kode som kjรธrer i ett system pรฅvirke minnet som brukes av et annet. |
| Databaser kan utvides ved รฅ legge til nye CPUer. | SMP-databaser bruker vanligvis รฉn CPU for รฅ utfรธre databasesรธk. |
| I et MPP-miljรธ forbedres ytelsen fordi ingen ressurser mรฅ deles mellom fysiske datamaskiner. | Arbeidsmengden for en parallell jobb er fordelt over prosessorene i systemet. |
| Ytelsen til et massivt parallellbehandlingssystem er lineรฆrt. Det vil imidlertid รธke proporsjonalt med antall noder. | SMP-databaser kan kjรธres pรฅ flere servere. Vil imidlertid dele en annen ressurs. |
Sammendrag
- Teradata betydning: Teradata er en รฅpen kildekode Databasestyringssystem for utvikling av store datavarehusapplikasjoner.
- Teradata var en avdeling av NCR Corporation. Det ble innlemmet i 1979, men skilte seg fra NCR i oktober 2007
- Teradata tilbyr en komplett tjenestepakke som fokuserer pรฅ datavarehus
- Teradata tilbyr lineรฆr skalerbarhet nรฅr du hรฅndterer store datavolumer ved รฅ legge til noder for รฅ รธke ytelsen til systemet.
- Tre viktige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processors (AMPs)
- Teradata tilbyr et komplett utvalg av produktsuiter for รฅ mรธte datavarehus- og ETL-behov til enhver organisasjon
- Teradata-applikasjonen brukes hovedsakelig til Supply Chain Management, Master Data Management, Demand Chain Management, etc.
