Talend Tutorial – Hva er Talend ETL Tool?

Oppsummering av talentopplæring

I denne Talend-opplæringen lærer du alle konseptene fra bunnen av. Denne opplæringen dekker grunnleggende til avanserte emner som What is Talend, Talend Tools historie, Talend Big Data, Fordeler med dataintegrasjon ved bruk av Talend Tool, Open-Studio-arkitektur og Talend Open Studio-utvidelser. Denne talentopplæringen er helt gratis.

Hva er Talend?

Talent er en åpen kildekode-programvareplattform som tilbyr dataintegrasjon og dataadministrasjonsløsninger. Talend spesialiserer seg på big data-integrasjon. Dette verktøyet gir funksjoner som sky, big data, integrering av bedriftsapplikasjoner, datakvalitet og masterdataadministrasjon. Det gir også et enhetlig depot for å lagre og gjenbruke metadataene.

Den er tilgjengelig i både åpen kildekode og premiumversjon. Det er et av de beste verktøyene for cloud computing og store data integrering.

Talends historie

År Milepæl
2002 FoU
2005 Bedriftsoppretting- Første runde med finansiering av AGF private equity & Galle Partners
2006 Open Studio V1.0 - Lanserte oss-operasjoner
2007 Integrasjonssuite/ lukket andre finansieringsrunde
2008 Åpne Profiler/ Data Quality
2009 Integration Suite RTx/MPx/ MDM-oppkjøp
2010 IDM Community Edition/ MDM Enterprise Edition
Åpent studio V
2014 OW2 beste prosjekt
2015 Anerkjent trendsettende produkt
2016 DBTA 100
2017 Gartner Magic Quadrant for dataintegrasjonsverktøy
2021 Innebygd integrasjon av søm med Amazon Redshift-konsoll

Talend Product Suite

Talend Product Suites består av 3 hovedprodukter som diskutert nedenfor:

Talent Big Data

Talend-verktøyet kan enkelt automatisere stordataintegrasjon med grafiske verktøy og veivisere. Dette lar organisasjonen utvikle et miljø for enkelt å jobbe med Apache Hadoop, Sparkog NoSQL databaser for sky- eller lokale jobber.

I dag bruker mange selskaper Hadoop for kostnadsbesparelser og ytelsesforbedring. Ofte bruker bedrifter dyr datatid med bedriftsløsningene. Med Hadoop kan data transformeres renset og beriket og integrert for høyere analytisk arbeidsbelastning.

Talend Sandbox inkluderer fire brukssaker

  1. Optimalisering av datavarehus
  2. Clickstream Analytics
  3. Sentimentanalyse for sosiale medier
  4. Apache-nettlogganalyse.

Du kan lage dine egne komplekse Use Cases.

Fordeler Talend for Big data Hadoop

  • Forbedre effektiviteten til big data jobbdesign ved å arrangere og konfigurere i et grafisk grensesnitt.
  • Legger til datakvalitet, skalerbarhet og administrasjonsfunksjoner
  • MapReduce-funksjonen gir raskere parallell databehandling
  • Delt arkiv og ekstern distribusjon
  • Datakvalitet og profilering med Data Cleansing
  • Forbedrer effektiviteten av jobbdesign med store data med GUI-grensesnitt
  • Innfødt støtte for HBase, HDFS, Hive, SqoopPig
  • Innebygd i Hortonworks Data Platform

Dataintegrasjon

Talent programvare for dataintegrering verktøyet har en åpen, skalerbar arkitektur. Det gir raskere respons på forretningsforespørsler. Verktøyet tilbyr å utvikle og distribuere dataintegreringsjobber raskere enn håndkoding.

Den lar deg enkelt integrere alle dine data med andre datavarehus eller synkronisere data mellom systemer. Dataintegrasjon innebærer å kombinere data som er lagret i forskjellige kilder og gi brukerne et enhetlig syn på disse dataene. Den hjelper deg med å administrere ulike ETL-jobber, og gir brukere mulighet til enkel, selvbetjent dataforberedelse.

Fordeler Talend for dataintegrasjon

Smidig integrasjon: Svar raskere på forretningsforespørsler uten å skrive kode ved å bruke over 1000 ut-av-boksen kontakter, Eclipse-baserte grafiske verktøy, og en optimalisert-for-ytelse kodegenerator.

Teamets produktivitet: Samarbeid ved å bruke kraftig versjonering, konsekvensanalyse, testing og feilsøking og metadataadministrasjon.

Enkel administrasjon: Verktøyet tilbyr avanserte planleggings- og overvåkingsfunksjoner. Den gir dataintegrasjon i sanntid med dashbord og sentralisert kontroll for rask distribusjon på tvers av flere noder.

Hold deg foran i konkurransen: Hvis du bruker dette verktøyet, trenger du ikke å vente på å bruke de nyeste og kuleste dataintegreringsfunksjonene.

Betal den laveste prisen for eierskap: Talend-verktøyet tilbyr abonnementsbasert prismodell. Du må betale for antall utviklere som bruker Talend Studio og dermed spare penger sammenlignet med flat lisensiering.

Integrasjonssky

Du kan akselerere skyen og lokale dataintegrasjonsprosjekter ved å bruke svært skalerbar og sikker skyintegrasjonsplattform-som-en-tjeneste (iPaaS). Talend-integrasjonsskyverktøyet tilbyr tilkobling, innebygd datakvalitet og generering av naturlig kode.

Talend er sikret skyintegrasjonsplattform som lar IT- og forretningsbrukere koble seg til delt både lokalt og lokalt. Den låser opp kraften i skydesignjobben da den kan administrere, overvåke og kontrollere i skyen.

Neste i denne Talend-opplæringen med eksempler, vil vi lære om fordelene med Talend-integrasjonsskyen fremfor andre verktøy.

Skyfordeler med integrering

Talend Integration Cloud Andre verktøy
900+ dra-n-slipp-komponenter Håndkoding som er uproduktiv
Genererer optimalisert kode Trenger spesialiserte ferdigheter
Samarbeid og ledelse Vanskelig å vedlikeholde
Gullstøtte (SLAer) Begrenset støtte

Hva er Talend Open Studio?

Talend Open Studio er en åpen arkitektur for dataintegrasjon, dataprofilering, big data, skyintegrasjon og mer.

Det er et GUI-miljø som tilbyr mer enn 1000 forhåndsbygde kontakter. Dette gjør det enkelt å utføre operasjoner som å transformere filer, laste inn data, flytte og gi nytt navn til filer. Den lar hver komponent definere komplekse prosesser.

Integrasjonsjobber opprettes fra Talend-komponenter som er konfigurert i stedet for kodet. Dessuten kan jobber kjøres fra utviklingsmiljøet, eller det kan kjøres som frittstående skript.

Fordeler med å bruke Talend Open studio

  • Det reduserer tiden det tar å utvikle integrasjon fra uker og måneder til dager eller til og med timer.
  • Den konverterer og oppdaterer data fra ulike kilder.
  • Overvåk og administrer vanskelige distribusjoner på en enkel måte
  • Du kan ha den laveste eierkostnaden for enhver løsning
  • Talend Open Source kan enkelt kombinere, konvertere og oppdatere data fra ulike kilder.
  • Talend Open Source-verktøy arver potensiell kraft til programmeringsplattformen.
  • Bredt utvalg av kilde-/målkoblinger gjør det til det beste valget i bransjen.
  • Leveres med sterke muligheter for flerskjemaloggfil/avstemmingsrapport (etter dataflyt/migrering)
Eldre ETL Talent
Egenskapsmotor Åpen
Vanskelig å skalere Big Data Genererer innfødt kode
Dyrt Lav TCO

Talend Open Studio- Architecture

Nå i denne Talend Open Studio-opplæringen vil vi lære om Talend Open Studio-arkitektur. Følgende er de 3 nøkkelkomponentene i Talend Open Studio Architecture

Talend Open Studio Architecture
Talend Open Studio Architecture

Klenter

Klientblokken inkluderer en eller flere Talend Studio(s) og nettlesere som bruker samme eller forskjellige maskiner. Talend Studio lar deg utføre dataintegrasjonsprosesser uavhengig av nivået på datavolumer og prosesskompleksitet.

Talend Server

Talend-serveren er en annen viktig blokk som inkluderer en nettbasert applikasjonsserver. Det muliggjør administrasjon og vedlikehold av alle prosjekter. Den inkluderer brukerkontoer, tilgangsrettigheter og prosjektautorisasjon i administrasjonsdatabasen.

Database

Databasekomponenten inkluderer administrasjon, revisjon og overvåking av databaser. Denne komponenten hjelper til med å administrere brukerkontoer, tilgangsrettigheter og prosjektautorisasjon. Revisjonsdatabasen hjelper til med å evaluere ulike aspekter ved jobbene for å utvikle et ideelt prosessorientert beslutningsstøttesystem.

Arbeidsområde

I Talend er et arbeidsområde en katalog der du lagrer alle prosjektmapper. For det vil du imidlertid kreve minst én arbeidsområdekatalog per tilkobling (repository-tilkobling). Talend lar deg koble til ulike arbeidsområdekataloger i tilfelle du ikke vil bruke standardkatalogene.

Oppbevaringssted

Et repository er lagringsområdet som TOS-verktøyet bruker til å samle data for å forklare forretningsmodeller eller for å designe jobber.

Talend Open Studio-utvidelser

Nå i denne Talend ETL-opplæringen vil vi lære om utvidelser av Talend åpent studio:

  • Talend Integration Suite
  • Talent On Demand
  • Talend Datakvalitet
  • Talent ESB
  • Talend Big Data-integrasjon

Konklusjon

  • Talend er en åpen kildekode-programvareplattform som tilbyr dataintegrasjon og dataadministrasjonsløsninger
  • Talend-programvare kan enkelt automatisere stordataintegrasjon med grafiske verktøy og veivisere
  • Talend Product Suite består av 3 hovedprodukter 1) Talend Big Data 2) Dataintegrasjon 3) Integrasjonssky
  • Talend tilbyr Dataintegritet, Datakartlegging og batchbehandling for Big Data og Dataintegrasjon.
  • Talent ETL-verktøy forbedrer effektiviteten til big data jobbdesign ved å arrangere og konfigurere i et grafisk grensesnitt
  • Programvareverktøyet Talend dataintegrering har en åpen, skalerbar arkitektur. Det gir raskere respons på forretningsforespørsler.
  • Talend-integrasjonsskyverktøyet tilbyr tilkobling, innebygd datakvalitet og generering av naturlig kode.
  • Talend Open Studio er en åpen arkitektur for dataintegrasjon, dataprofilering, big data, skyintegrasjon og mer.
  • Fem Talend-studioutvidelser er: Talend Integration Suite, Talend On Demand, Talend Data Quality, Talend Seanad Talend Big Data Integration