Teradata Tutorial: Hvad er Teradata SQL? Database Architecture

Hvad er Teradata?

Teradata er et open source-databasestyringssystem til udvikling af store data warehousing-applikationer. Dette vรฆrktรธj giver stรธtte til flere datavarehusoperationer samtidigt ved at bruge konceptet parallelisme. Teradata er et massivt รฅbent behandlingssystem, der understรธtter Unix/Linux/Windows server platforme.

Teradata software er udviklet af Teradata Corporation, som er et amerikansk it-firma. Det er en leverandรธr af analytiske dataplatforme, applikationer og andre relaterede tjenester. Firmaet udvikler et produkt til at konsolidere data fra forskellige kilder og gรธre dataene tilgรฆngelige for analyse.

Teradatas historie

Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007. Michael Koehler blev den fรธrste administrerende direktรธr for Teradata.

Teradata Corporations milepรฆle:

  • 1979 โ€“ Teradata blev inkorporeret
  • 1984 โ€“ Frigivelse af fรธrste databasecomputer DBC/1012
  • 1986 - Fortune magazine erklรฆrede Teradata som 'ร…rets produkt'
  • 1999 โ€“ Stรธrste database bygget ved hjรฆlp af Teradata med 130 Terabyte
  • 2002 โ€“ Teradata V2R5 versionsudgivelse med komprimering og Partition Primary
  • 2006 โ€“ Lancering af Teradata Master Data Management-lรธsning
  • 2008 โ€“ Teradata 13.0 udgivet med Active Data Warehousing
  • 2011 โ€“ Kรธber Teradata Aster og kaster sig ud i Advanced Analytics Space
  • 2012 โ€“ Teradata 14.0 introduceret
  • 2014 โ€“ Teradata 15.0 introduceret
  • 2015- Teradata kรธber Apps Marketing Platform Appoxee
  • 2016- Terada gรฅr sammen med Big data
  • 2017- Teradata erhverver San Diegos StackIQ

Hvorfor Teradata?

  • Teradata tilbyder en komplet pakke af tjenester, der fokuserer pรฅ Datavarehousing
  • Systemet er bygget pรฅ รฅben arkitektur. Sรฅ hver gang hurtigere enheder stilles til rรฅdighed, kan de indarbejdes i den allerede opbyggede arkitektur.
  • Teradata understรธtter 50+ petabyte data.
  • Enkeltbetjeningsvisning for et stort Teradata multi-node system ved hjรฆlp af Service Workstation
  • Kompatibel med en bred vifte af BI vรฆrktรธj at hente data.
  • Det kan fungere som et enkelt kontrolpunkt for DBA til at styre Database.
  • Hรธj ydeevne, forskellige forespรธrgsler, analyse i databasen og sofistikeret styring af arbejdsbelastning
  • Teradata giver dig mulighed for at fรฅ de samme data pรฅ flere implementeringsmuligheder

Nรฆste i denne Teradata-tutorial lรฆrer vi om funktionerne i Teradata.

Funktioner i Teradata SQL

Teradata tilbyder fรธlgende kraftfulde funktioner:

  • Lineรฆr skalerbarhed: Tilbyder lineรฆr skalerbarhed ved hรฅndtering af store mรฆngder data ved at tilfรธje noder for at รธge systemets ydeevne.
  • Ubegrรฆnset parallelisme: Teradata er baseret pรฅ MPP (Massively Parallel Processing). Architecture). Sรฅ det er designet til at vรฆre parallelt siden begyndelsen. Den kan dele en stor opgave op i mindre opgaver og kรธre dem parallelt
  • Mature Optimizer: Teradata Optimizer kan hรฅndtere op til 64 joinforbindelser i en forespรธrgsel.
  • Lav TCO: Tera-data har lave samlede ejeromkostninger. Det er nemt at konfigurere, vedligeholde og administrere.
  • Indlรฆs og aflรฆs hjรฆlpeprogrammer: Teradata leverer ind- og udlรฆsningsvรฆrktรธjer til at flytte data ind i/fra Teradata System.
  • Tilslutning: Dette MPP-system kan oprette forbindelse til kanaltilknyttede systemer som en mainframe eller netvรฆrkstilsluttede systemer.
  • SQL: Teradata understรธtter SQL at interagere med de data, der er gemt i tabeller. Det giver sin forlรฆngelse.
  • Robuste hjรฆlpeprogrammer: Teradata leverer robuste vรฆrktรธjer til at importere/eksportere data fra/til Teradata-systemer som FastExport, FastLoad, MultiLoad og TPT.
  • Automatisk distribution: Teradata kan distribuere dataene til diskene automatisk uden manuel indgriben.

Nรฆste i denne Teradata SQL-tutorial lรฆrer vi om Teradata Architecture.

Teradata Architecture

Teradata-arkitektur er en massivt parallel behandling Architecture.

Tre vigtige komponenter i Teradata er:

  • Parsing Engine
  • BYNET
  • Access Module Processorer (AMP'er)

Teradata lagring Architecture Database ArchiTecture Diagram:

Teradata Architecture
Teradata Architecture diagram

Teradata lagring Architecture

Parsing Engine:

Parsing Engine analyserer forespรธrgslerne og forbereder udfรธrelsesplanen. Det administrerer sessioner for brugere. Det optimerer og sender en anmodning til brugerne.

Sรฅ nรฅr klienten udfรธrer forespรธrgsler for at indsรฆtte poster, sender Parsing Engine posterne til Message Passing-laget. Message passing layer eller BYNET er en software- og hardwarekomponent. Det tilbyder netvรฆrkskapacitet. Den henter ogsรฅ posterne og sender rรฆkken til mรฅl-AMP.

Amp:

AMP stรฅr for Access Module Processor. Det gemmer poster pรฅ disse diske. AMP udfรธrer fรธlgende aktiviteter:

  • Styrer en del af databasen
  • Styrer en del af hvert bord
  • Udfรธr alle de opgaver, der er forbundet med at generere resultatsรฆt, sรฅsom sortering, aggregering og joinforbindelse
  • Udfรธr lรฅse- og pladsstyring

Teradata-hentning Architecture

Nรฅr klienten kรธrer forespรธrgsler for at hente poster, sender parsing-motoren en anmodning til BYNET. Derefter sender BYNET genfindingsanmodningen til passende AMP'er.

AMP'er sรธger parallelt pรฅ deres diske og genkender de nรธdvendige poster og sender dem til BYNET. BYNET sender posterne til Parsing Engine, som igen vil blive sendt til klienten.

Dernรฆst i denne Teradata Database-รธvelse lรฆrer vi om Teradata SQL-kommandoer.

Typer af Teradata SQL-kommandoer

Teradata Database understรธtter fรธlgende grundlรฆggende SQL-kommandoer:

  1. Data Definition Language (DDL) kommandoer
  2. Data Control Language (DCL) kommandoer
  3. Data Manipulation Language (DML) kommandoer

Data Definition Language kommandoer

KOMMANDO Beskrivelse
SKAB Opretter en ny database, tabel, bruger osv.
DROP Fjerner en ny database, tabel, bruger osv.
ร†NDRE ร†ndrer en tabel, kolonne, trigger osv.
MODIFICERE ร†ndrer en database eller brugerdefinition
OMDร˜B ร†ndrer navn pรฅ tabeller, visninger, makroer osv.

Sprogkommandoer for datakontrol

KOMMANDO Beskrivelse
TILDEL/ TILBAGETRร†KKE Bruges til at kontrollere privilegier for en bruger pรฅ et objekt
TILDEL LOGON/TILBAGE LOGON Bruges til at kontrollere logonrettigheder til en vรฆrt eller vรฆrtsgruppe
GIVE Bruges til at give et databaseobjekt til et andet databaseobjekt

Teradata Database SQL Data Manipulation Language kommandoer

KOMMANDO Beskrivelse
SLET Fjerner en rรฆkke fra tabellen
ECHO Bruges til at ekko en streng eller kommando til klienten
KONTROLPUNKT Definerer et gendannelsespunkt i journalen, der senere kan bruges til at gendanne tabelindholdet
SELECT Bruges til at returnere bestemte rรฆkkedata i en tabelform
OPDATER ร†ndrer data i en eller flere rรฆkker i en tabel

Anvendelser af Teradata-databasen

Fรธlgende er de populรฆre Teradata-applikationer:

  • Kundedatahรฅndtering: Hjรฆlper med at opretholde langvarige relationer med kunder.
  • Master Data Management: Hjรฆlper med at udvikle et miljรธ, hvor stamdata kan bruges, synkroniseres og gemmes.
  • ร˜konomi og resultatstyring: Hjรฆlper organisationen med at forbedre hastigheden og kvaliteten af โ€‹โ€‹finansiel rapportering. Det reducerer omkostningerne til finansieringsinfrastruktur og styrer virksomhedens ydeevne proaktivt.
  • Supply Chain Management: Forbedre forsyningskรฆdedriften, som hjรฆlper til forbedret kundeservice, reducerede cyklustider og lavere varebeholdninger.
  • Efterspรธrgselskรฆdestyring: Hjรฆlper med at รธge kundeserviceniveauer og salg. Det hjรฆlper ogsรฅ virksomheder med at forudsige efterspรธrgslen efter deres butiksvarer nรธjagtigt.

Nรฆste i denne Teradata for begyndere tutorial, vil vi lรฆre om forskellen mellem Teradata og andre RDBMS.

Forskellen mellem Teradata og andre RDBMS

Parameter TERA DATA RDBMS
Architectures Fรธlger Shared Nothing Architecture. Delte alt og tillader ressourcestrid.
Processer MIPS [Millioner af instruktioner/sek.] KIPS [Tusindvis af institutioner/sek.]
Indexes Bedre distribution og genfinding Tilbyder kun FASI Retrieval
parallelitet Understรธtter ubetinget parallelisme. Parallelisme er betinget og uforudsigelig
Bulk belastning Teradata tillader bulk load. Tillader kun begrรฆnset bulkbelastning.
Skalerbarhed Lineรฆr skalerbarhed med en hรฆldning pรฅ รฉn Skalerbarhed med faldende afkast
Database buffer En enkelt databasebuffer brugt af alle UoP'er. (En enhed af parallelisme). Et enkelt datalager, som alle UoP'er har adgang til Query Controller sender funktioner til UoP'er, der ejer dataene
butikker Det gemmer TERA BYTES[Billioner af rรฆkker] GIGA BYTES[Millioner af rรฆkker]

MPP vs. SMP

MPP SMP
MPP โ€“ Massively Parallel Processing. Det er computersystem, som er knyttet til mange uafhรฆngige aritmetiske enheder eller hele mikroprocessorer, der kรธrer parallelt. Symmetrisk multi-behandling. I et SMP-behandlingssystem deler CPU'erne den samme hukommelse, og som et resultat kan kode, der kรธrer i et system, pรฅvirke den hukommelse, der bruges af et andet.
Databaser kan udvides ved at tilfรธje nye CPU'er. SMP-databaser bruger generelt รฉn CPU til at udfรธre databasesรธgninger.
I et MPP-miljรธ forbedres ydeevnen, fordi ingen ressourcer skal deles mellem fysiske computere. Arbejdsbyrden for et paralleljob er fordelt pรฅ tvรฆrs af processorerne i systemet.
Ydeevnen af โ€‹โ€‹et massivt parallelt behandlingssystem er lineรฆrt. Det vil dog stige i forhold til antallet af noder. SMP-databaser kan kรธre pรฅ flere servere. Vil dog dele en anden ressource.

Resumรฉ

  • Teradata betydning: Teradata er en open source Databasestyringssystem til udvikling af store data warehousing applikationer.
  • Teradata var en afdeling af NCR Corporation. Det blev indlemmet i 1979, men skiltes fra NCR i oktober 2007
  • Teradata tilbyder en komplet pakke af tjenester, der fokuserer pรฅ Data Warehousing
  • Teradata tilbyder lineรฆr skalerbarhed, nรฅr de hรฅndterer store mรฆngder data ved at tilfรธje noder for at รธge systemets ydeevne.
  • Tre vigtige komponenter i Teradata er 1) Parsing Engine 2) MPP 3) Access Module Processorer (AMP'er)
  • Teradata tilbyder et komplet udvalg af produktsuiter til at opfylde data warehousing og ETL behov i enhver organisation
  • Teradata-applikation bruges hovedsageligt til Supply Chain Management, Master Data Management, Demand Chain Management osv.

Opsummer dette indlรฆg med: