Deep Learning Tutorial aloittelijoille: Neuraaliverkon perusteet

Mikรค on syvรคoppiminen?

Deep Learning on tietokoneohjelmisto, joka jรคljittelee aivojen neuronien verkkoa. Se on koneoppimisen osajoukko, joka perustuu keinotekoisiin hermoverkkoihin, joissa on esitysoppiminen. Sitรค kutsutaan syvรคoppimiseksi, koska se hyรถdyntรครค syviรค hermoverkkoja. Tรคmรค oppiminen voi olla ohjattua, puoliohjattua tai ohjaamatonta.

Syvรคoppimisalgoritmit rakennetaan yhdistetyistรค kerroksista.

  • Ensimmรคistรค kerrosta kutsutaan syรถttรถtasoksi
  • Viimeistรค kerrosta kutsutaan tulostuskerrokseksi
  • Kaikkia kerroksia niiden vรคlissรค kutsutaan piilotasoiksi. Sana syvรค tarkoittaa, ettรค verkko yhdistรครค hermosolut useammassa kuin kahdessa kerroksessa.
Deep Learning
Mikรค on syvรคoppiminen?

Jokainen piilotettu kerros koostuu neuroneista. Neuronit ovat yhteydessรค toisiinsa. Neuroni kรคsittelee ja levittรครค sitten tulosignaalia, jonka se vastaanottaa sen ylรคpuolella olevan kerroksen. Seuraavassa kerroksessa hermosolulle antaman signaalin voimakkuus riippuu painosta, biasista ja aktivointifunktiosta.

Verkko kuluttaa suuria mรครคriรค syรถttรถdataa ja kรคyttรครค niitรค useiden kerrosten kautta; verkko voi oppia datan yhรค monimutkaisempia ominaisuuksia kullakin tasolla.

Syvรคoppimisprosessi

Syvรค hermoverkko tarjoaa huippuluokan tarkkuuden monissa tehtรคvissรค kohteen havaitsemisesta puheentunnistukseen. He voivat oppia automaattisesti ilman ohjelmoijien nimenomaisesti koodaamaa ennalta mรครคritettyรค tietoa.

Syvรคoppimisprosessi
Syvรคoppimisprosessi

Ymmรคrtรครคksesi syvรคn oppimisen ajatuksen, kuvittele perhe, jossa on vauva ja vanhemmat. Taaperolapsi osoittaa esineitรค pikkusormellaan ja sanoo aina sanan "kissa". Koska hรคnen vanhempansa ovat huolissaan hรคnen koulutuksestaan, he sanovat hรคnelle jatkuvasti "Kyllรค, se on kissa" tai "Ei, se ei ole kissa." Vauva osoittaa jatkuvasti esineitรค, mutta tarkentuu "kissojen" kanssa. Pieni lapsi syvรคllรค sisimmรคssรครคn ei tiedรค, miksi hรคn voi sanoa, ettรค se on kissa tai ei. Hรคn on juuri oppinut hierarkioimaan kissan monimutkaiset ominaisuudet katsomalla lemmikin yleistรค ja keskittyรค edelleen yksityiskohtiin, kuten hรคnnรคt tai nenรค ennen pรครคtรถksensรค.

Hermoverkko toimii aivan samalla tavalla. Jokainen kerros edustaa syvempรครค tiedon tasoa eli tiedon hierarkiaa. Neuraaliverkko, jossa on neljรค kerrosta, oppii monimutkaisemman ominaisuuden kuin kaksikerroksinen.

Oppiminen tapahtuu kahdessa vaiheessa:

Ensimmรคinen vaihe: Ensimmรคinen vaihe koostuu syรถtteen epรคlineaarisen muunnoksen soveltamisesta ja tilastollisen mallin luomisesta tulosteena.
Toinen vaihe: Toisessa vaiheessa pyritรครคn parantamaan mallia matemaattisella menetelmรคllรค, joka tunnetaan derivaatana.

Neuraaliverkko toistaa nรคmรค kaksi vaihetta satoja tai tuhansia kertoja, kunnes se on saavuttanut siedettรคvรคn tarkkuustason. Tรคmรคn kaksivaiheisen vaiheen toistoa kutsutaan iteraatioksi.

Antaaksesi esimerkin syvรคoppimisesta, katso alla olevaa liikettรค, malli yrittรครค oppia tanssimaan. 10 minuutin harjoittelun jรคlkeen malli ei osaa tanssia, ja se nรคyttรครค raapukselta.

Syvรคoppimisprosessi

48 tunnin oppimisen jรคlkeen tietokone hallitsee tanssin taidon.

Syvรคoppimisprosessi

Neuroverkkojen luokittelu

Matala neuroverkko: Shallow-hermoverkossa on vain yksi piilotettu kerros tulon ja lรคhdรถn vรคlissรค.

Syvรค hermoverkko: Syvillรค neuroverkoilla on useampi kuin yksi kerros. Esimerkiksi Google LeNet -malli kuvantunnistukseen laskee 22 kerrosta.

Nykyรครคn syvรคoppimista kรคytetรครคn monilla tavoilla, kuten kuljettajaton auto, matkapuhelin, Google-hakukone, petosten havaitseminen, televisio ja niin edelleen.

Syvรคoppimisverkostojen tyypit

Nyt tรคssรค Deep Neural Network -opetusohjelmassa opimme syvien oppimisverkkojen tyypeistรค:

Syvรคoppimisverkostojen tyypit
Syvรคoppimisverkostojen tyypit

Feed-forward-hermoverkot

Yksinkertaisin keinotekoisen hermoverkon tyyppi. Tรคmรคn tyyppisessรค arkkitehtuurissa tieto virtaa vain yhteen suuntaan, eteenpรคin. Se tarkoittaa, ettรค tietovirrat alkavat syรถttรถkerroksesta, menevรคt "piilotettuihin" kerroksiin ja pรครคttyvรคt tuloskerrokseen. Verkko

ei ole silmukkaa. Tiedot pysรคhtyvรคt tulostekerroksiin.

Toistuvat neuroverkot (RNN:t)

RNN on monikerroksinen hermoverkko, joka voi tallentaa tietoa kontekstisolmuihin, jolloin se voi oppia datasekvenssejรค ja tulostaa numeron tai muun sekvenssin. Yksinkertaisesti sanottuna se on keinotekoinen hermoverkko, jonka hermosolujen vรคliset yhteydet sisรคltรคvรคt silmukoita. RNN:t sopivat hyvin syรถtteiden sekvenssien kรคsittelyyn.

Toistuvat hermoverkot

Toistuvat hermoverkot

Esimerkiksi, jos tehtรคvรคnรค on ennustaa seuraava sana lauseessa โ€Haluatkoโ€ฆโ€ฆโ€ฆโ€ฆ?

  • RNN-neuronit vastaanottavat signaalin, joka osoittaa lauseen alkuun.
  • Verkko vastaanottaa syรถtteenรค sanan "Do" ja tuottaa numeron vektorin. Tรคmรค vektori syรถtetรครคn takaisin neuroniin muistin muodostamiseksi verkkoon. Tรคmรค vaihe auttaa verkkoa muistamaan, ettรค se sai "Tee" ja se vastaanotti sen ensimmรคisellรค paikalla.
  • Verkko jatkaa samalla tavalla seuraaviin sanoihin. Se vaatii sanat "sinรค" ja "halua". Neuronien tila pรคivitetรครคn jokaisen sanan vastaanoton yhteydessรค.
  • Viimeinen vaihe tapahtuu sanan "a" vastaanottamisen jรคlkeen. Neuraaliverkko antaa todennรคkรถisyyden jokaiselle englanninkieliselle sanalle, jota voidaan kรคyttรครค lauseen tรคydentรคmiseen. Hyvin koulutettu RNN antaa todennรคkรถisesti suuren todennรคkรถisyyden "kahvilalle", "juomalle", "hampurilaiselle" jne.

RNN:n yleiset kรคyttรถtavat

  • Auta arvopaperikauppiaita luomaan analyyttisiรค raportteja
  • Havaitse poikkeamat tilinpรครคtรถssopimuksesta
  • Tunnista vilpillinen luottokorttitapahtuma
  • Anna kuville kuvateksti
  • Power chatbotit
  • RNN:n vakiokรคyttรถ tapahtuu, kun harjoittajat tyรถskentelevรคt aikasarjadatan tai -sekvenssien (esim. รครคnitallenteiden tai tekstin) kanssa.

Konvoluutio-neuroverkot (CNN)

CNN on monikerroksinen hermoverkko, jolla on ainutlaatuinen arkkitehtuuri, joka on suunniteltu poimimaan yhรค monimutkaisempia ominaisuuksia kunkin kerroksen datasta tulosten mรครคrittรคmiseksi. CNN:t sopivat hyvin havainnointitehtรคviin.

Konvoluutiohermoverkko

Konvoluutiohermoverkko

CNN:รครค kรคytetรครคn enimmรคkseen silloin, kun on olemassa strukturoimaton tietojoukko (esim. kuvat) ja ammatinharjoittajien tรคytyy poimia siitรค tietoa.

Jos tehtรคvรคnรค on esimerkiksi ennustaa kuvan kuvateksti:

  • CNN vastaanottaa kuvan vaikkapa kissasta, tรคmรค kuva on tietokoneella sanottuna kokoelma pikseliรค. Yleensรค yksi kerros harmaasรคvykuvalle ja kolme kerrosta vรคrikuvalle.
  • Ominaisuuden oppimisen aikana (eli piilotetut kerrokset) verkko tunnistaa ainutlaatuisia ominaisuuksia, kuten kissan hรคnnรคn, korvan jne.
  • Kun verkko on oppinut perusteellisesti tunnistamaan kuvan, se voi antaa todennรคkรถisyyden jokaiselle tuntemalleen kuvalle. Todennรคkรถisimmin etiketistรค tulee verkon ennuste.

Vahvistusoppiminen

Vahvistusoppiminen on koneoppimisen alakenttรค, jossa jรคrjestelmiรค koulutetaan vastaanottamalla virtuaalisia "palkintoja" tai "rangaistuksia", lรคhinnรค yrityksen ja erehdyksen avulla. Googlen DeepMind on kรคyttรคnyt vahvistusoppimista voittaakseen ihmismestarin Go-peleissรค. Vahvistusoppimista kรคytetรครคn myรถs videopeleissรค parantamaan pelikokemusta tarjoamalla รคlykkรครคmpiรค botteja.

Yksi tunnetuimmista algoritmeista on:

  • Q-oppiminen
  • Syvรค Q-verkko
  • State-Action-Reward-State-Action (SARSA)
  • Deep Deterministic Policy Gradient (DDPG)

Esimerkkejรค syvรคn oppimisen sovelluksista

Tรคssรค Deep learning aloittelijoille -opetusohjelmassa opitaan Deep Learning -sovelluksista:

Tekoรคly rahoituksessa

Finanssiteknologiasektori on jo alkanut kรคyttรครค tekoรคlyรค sรครคstรครคkseen aikaa, alentaakseen kustannuksia ja lisรคtรคkseen arvoa. Syvรคoppiminen muuttaa luotonantoalaa kรคyttรคmรคllรค tehokkaampaa luottoluokitusta. Luottopรครคtรถksentekijรคt voivat kรคyttรครค tekoรคlyรค vankoihin luottoluottohakemuksiin nopeamman ja tarkemman riskinarvioinnin saavuttamiseksi kรคyttรคmรคllรค koneรคlyรค huomioimaan hakijoiden luonteen ja kapasiteetin.

Underwrite on Fintech-yritys, joka tarjoaa tekoรคlyratkaisuja luottoyhtiรถille. underwrite.ai kรคyttรครค tekoรคlyรค tunnistamaan, kumpi hakija maksaa todennรคkรถisemmin lainan takaisin. Heidรคn lรคhestymistapansa ylittรครค radikaalisti perinteiset menetelmรคt.

AI HR:ssรค

Under Armour, urheiluvaateyritys mullistaa palkkaamisen ja modernisoi ehdokkaiden kokemusta tekoรคlyn avulla. Itse asiassa Under Armour lyhentรครค vรคhittรคiskauppojen palkkaamisaikaa 35%. Under Armour kohtasi kasvavaa suosiota jo vuonna 2012. Heillรค oli keskimรครคrin 30000 XNUMX ansioluetteloa kuukaudessa. Kaikkien nรคiden hakemusten lukeminen ja seulonta- ja haastatteluprosessin aloittaminen kesti liian kauan. Pitkรค prosessi ihmisten palkkaamiseksi ja laivaan ottamiseksi vaikutti Under Armourin kykyyn saada vรคhittรคiskaupat tรคyteen miehistรถihin, rampatettuihin ja toimintavalmiisiin.

Tuolloin Under Armourilla oli kaikki "must have" HR-tekniikka, kuten hankintaan, soveltamiseen, seurantaan ja kรคyttรถรถnottoon liittyvรคt transaktioratkaisut, mutta ne eivรคt olleet tarpeeksi hyรถdyllisiรค. Valitse panssarin alla HireVue, HR-ratkaisujen tekoรคlytoimittaja sekรค tilaus- ettรค livehaastatteluihin. Tulokset olivat bluffausta; ne onnistuivat lyhentรคmรครคn tรคyttรถaikaa 35 %. Vastineeksi palkattu laadukkaampi henkilรถkunta.

AI markkinoinnissa

Tekoรคly on arvokas tyรถkalu asiakaspalvelun hallintaan ja personointihaasteisiin. Parannettu puheentunnistus puhelinkeskuksen hallinnassa ja puhelujen reitityksessรค AI-tekniikoiden soveltamisen ansiosta mahdollistaa saumattoman kokemuksen asiakkaille.

Esimerkiksi รครคnen syvรคoppimisen analyysi mahdollistaa jรคrjestelmien arvioinnin asiakkaan tunnesรคvyn. Jos asiakas vastaa huonosti AI chatbot, jรคrjestelmรค voidaan reitittรครค keskustelu todellisille ihmisoperaattoreille, jotka ottavat asian hoitaakseen.

Kolmen yllรค olevan syvรคoppimisen esimerkin lisรคksi tekoรคlyรค kรคytetรครคn laajalti muilla aloilla/toimialoilla.

Miksi syvรคoppiminen on tรคrkeรครค?

Syvรคoppiminen on tehokas tyรถkalu tehdรค ennustamisesta toimiva tulos. Syvรคoppiminen loistaa kuvioiden lรถytรคmisessรค (ohjaamaton oppiminen) ja tietoon perustuvassa ennustamisessa. Big data on polttoaine syvรครคn oppimiseen. Kun molemmat yhdistetรครคn, organisaatio voi saada ennennรคkemรคttรถmiรค tuloksia tuottavuuden, myynnin, johtamisen ja innovaatioiden osalta.

Syvรคoppiminen voi menestyรค paremmin kuin perinteinen menetelmรค. Esimerkiksi syvรคoppimisalgoritmit ovat 41 % tarkempia kuin koneoppimisalgoritmi kuvien luokittelussa, 27 % tarkempia kasvojentunnistuksessa ja 25 % tarkempia รครคnentunnistuksessa.

Syvรคoppimisen rajoitukset

Nyt tรคssรค hermoverkko-opetusohjelmassa opimme Deep Learningin rajoituksista:

Tietojen merkinnรคt

Useimmat nykyiset tekoรคlymallit koulutetaan "ohjatun oppimisen kautta". Se tarkoittaa, ettรค ihmisten on merkittรคvรค ja luokiteltava taustalla olevat tiedot, mikรค voi olla mittava ja virhealtis urakka. Esimerkiksi itse ajavien autojen teknologioita kehittรคvรคt yritykset palkkaavat satoja ihmisiรค kirjoittamaan manuaalisesti tuntikausia videosyรถtteitรค prototyyppiajoneuvoista auttaakseen nรคiden jรคrjestelmien kouluttamista.

Hanki valtavia koulutustietojoukkoja

On osoitettu, ettรค yksinkertaiset syvรคoppimistekniikat, kuten CNN, voivat joissain tapauksissa jรคljitellรค lรครคketieteen ja muiden alojen asiantuntijoiden tietรคmystรค. Nykyinen aalto koneoppiminenvaatii kuitenkin koulutustietosarjoja, jotka eivรคt ole vain merkittyjรค, vaan myรถs riittรคvรคn laajoja ja yleismaailmallisia.

Syvรคoppimismenetelmรคt vaativat tuhansia havaintoja, jotta malleista tulisi suhteellisen hyviรค luokittelutehtรคvissรค, ja joissakin tapauksissa miljoonia, jotta ne suoriutuivat ihmisen tasolla. Ilman yllรคtystรค syvรคoppiminen on kuuluisa jรคttilรคisteknologiayrityksissรค; he kรคyttรคvรคt big dataa kerรคtรคkseen petabyyttiรค tietoa. Sen avulla he voivat luoda vaikuttavan ja erittรคin tarkan syvรคoppimismallin.

Selitรค ongelma

Suuria ja monimutkaisia โ€‹โ€‹malleja voi olla vaikea selittรครค inhimillisesti. Esimerkiksi miksi tietty pรครคtรถs tehtiin. Se on yksi syy siihen, ettรค joidenkin tekoรคlytyรถkalujen hyvรคksyminen on hidasta sovellusalueilla, joilla tulkittavuus on hyรถdyllistรค tai jopa vรคlttรคmรคtรถntรค.

Lisรคksi, kun tekoรคlyn sovellus laajenee, sรครคntelyvaatimukset voivat myรถs lisรคtรค tarvetta selitettรคville tekoรคlymalleille.

Yhteenveto

Syvรคoppimisen yleiskatsaus: Syvรคoppiminen on uusi huipputekniikka tekoรคly. Syvรคoppimisarkkitehtuuri koostuu syรถttรถkerroksesta, piilotetuista kerroksista ja tulostekerroksesta. Sana syvรค tarkoittaa, ettรค on enemmรคn kuin kaksi tรคysin yhdistettyรค kerrosta.

On olemassa valtava mรครคrรค neuroverkkoja, joissa jokainen arkkitehtuuri on suunniteltu suorittamaan tietty tehtรคvรค. Esimerkiksi CNN toimii erittรคin hyvin kuvien kanssa, RNN tarjoaa vaikuttavia tuloksia aikasarjoilla ja tekstianalyysillรค.

Syvรคoppiminen on nyt aktiivista eri aloilla rahoituksesta markkinointiin, toimitusketjuun ja markkinointiin. Suuret yritykset ovat ensimmรคisiรค, jotka kรคyttรคvรคt syvรคoppimista, koska niillรค on jo suuri tietovarasto. Syvรคoppiminen vaatii laajan harjoitustietojoukon.

Tiivistรค tรคmรค viesti seuraavasti: