Mélytanulási oktatóanyag kezdőknek: Neurális hálózat alapjai
Mi az a mélytanulás?
Deep Learning egy számítógépes szoftver, amely utánozza az agy neuronjainak hálózatát. Ez a gépi tanulás egy részhalmaza, amely mesterséges neurális hálózatokon alapul reprezentációs tanulással. Mély tanulásnak nevezik, mert mély neurális hálózatokat használ. Ez a tanulás lehet felügyelt, félig felügyelt vagy felügyelet nélküli.
A mélytanulási algoritmusok összekapcsolt rétegekből épülnek fel.
- Az első réteget bemeneti rétegnek nevezik
- Az utolsó réteget kimeneti rétegnek nevezzük
- Az összes közötti réteget rejtett rétegeknek nevezzük. A mély szó azt jelenti, hogy a hálózat több mint két rétegben csatlakozik a neuronokhoz.

Minden rejtett réteg neuronokból áll. A neuronok kapcsolódnak egymáshoz. A neuron feldolgozza, majd továbbítja a bemeneti jelet, amelyet a felette lévő rétegben kap. A következő rétegben a neuronnak adott jel erőssége a súlytól, a torzítástól és az aktiválási funkciótól függ.
A hálózat nagy mennyiségű bemeneti adatot fogyaszt, és több rétegen keresztül működteti azokat; a hálózat az egyes rétegeken lévő adatok egyre összetettebb jellemzőit tudja megtanulni.
Mély tanulási folyamat
A mély neurális hálózat a legkorszerűbb pontosságot biztosítja számos feladatban, az objektumészleléstől a beszédfelismerésig. Automatikusan tanulhatnak, a programozók által kifejezetten kódolt előre meghatározott tudás nélkül.

A mély tanulás gondolatának megértéséhez képzeljünk el egy családot, csecsemővel és szülőkkel. A kisgyermek a kisujjával mutat tárgyakat, és mindig azt mondja, hogy „macska”. Mivel a szülei aggódnak az oktatása miatt, folyton azt mondják neki: „Igen, ez egy macska” vagy „Nem, ez nem macska”. A csecsemő továbbra is mutogat a tárgyakra, de pontosabbá válik a „macskákkal”. A kisgyerek legbelül nem tudja, miért mondhatja azt, hogy macska vagy sem. Nemrég tanulta meg, hogyan hierarchizálja a macskák összetett jellemzőit úgy, hogy megnézi a házi kedvencét, és továbbra is olyan részletekre összpontosít, mint a farok vagy az orr, mielőtt döntést hozna.
A neurális hálózat teljesen ugyanúgy működik. Mindegyik réteg a tudás mélyebb szintjét, azaz a tudás hierarchiáját képviseli. A négyrétegű neurális hálózat bonyolultabb tulajdonságokat tanul meg, mint a kétrétegű.
A tanulás két szakaszban zajlik:
Első fázis: Az első fázis a bemenet nemlineáris transzformációjának alkalmazásából és egy statisztikai modell létrehozásából áll kimenetként.
Második szakasz: A második fázis célja a modell fejlesztése a deriváltként ismert matematikai módszerrel.
A neurális hálózat ezt a két fázist száz-ezerszer megismétli, amíg el nem éri az elviselhető pontossági szintet. Ennek a kétfázisnak az ismétlődését iterációnak nevezzük.
Ha egy mély tanulási példát szeretnél bemutatni, nézd meg az alábbi mozdulatot, a modell táncolni próbál tanulni. 10 perc edzés után a modell nem tudja, hogyan kell táncolni, és úgy néz ki, mint egy firka.
48 óra tanulás után a számítógép elsajátítja a táncművészetet.
A neurális hálózatok osztályozása
Sekély neurális hálózat: A sekély neurális hálózatnak csak egy rejtett rétege van a bemenet és a kimenet között.
Mély idegi hálózat: A mély neurális hálózatoknak egynél több rétegük van. Például a Google LeNet képfelismerési modellje 22 réteget számol.
Manapság a mély tanulást sokféleképpen használják, például vezető nélküli autót, mobiltelefont, Google keresőmotort, csalásfelderítést, TV-t stb.
A mély tanulási hálózatok típusai
Ebben a Deep Neural Network oktatóanyagban a mély tanulási hálózatok típusairól fogunk tanulni:

Feed-forward neurális hálózatok
A mesterséges neurális hálózat legegyszerűbb típusa. Az ilyen típusú architektúra esetén az információ csak egy irányba, előre áramlik. Ez azt jelenti, hogy az információáramlás a bemeneti rétegnél kezdődik, a „rejtett” rétegekre megy, és a kimeneti rétegnél ér véget. A hálózat
nem rendelkezik hurokkal. Az információ a kimeneti rétegeknél megáll.
Ismétlődő neurális hálózatok (RNN-ek)
RNN egy többrétegű neurális hálózat, amely információkat tárolhat kontextus csomópontokban, lehetővé téve az adatszekvenciák megtanulását és egy szám vagy más sorozat kiadását. Egyszerűen fogalmazva, ez egy mesterséges neurális hálózat, amelynek a neuronok közötti kapcsolatai hurkokat tartalmaznak. Az RNN-ek kiválóan alkalmasak bemeneti szekvenciák feldolgozására.

Például, ha a feladat az, hogy megjósolja a következő szót a következő mondatban: „Akarsz egy…………?
- Az RNN neuronok olyan jelet kapnak, amely a mondat elejére mutat.
- A hálózat a „Do” szót kapja bemenetként, és előállítja a szám vektorát. Ezt a vektort visszacsatolják az idegsejtekbe, hogy memóriát biztosítsanak a hálózatnak. Ez a szakasz segít a hálózatnak emlékezni arra, hogy „Do”-t kapott, és az első helyen kapta meg.
- A hálózat hasonlóan folytatja a következő szavakat. Ehhez a „te” és a „akarom” szó kell. A neuronok állapota minden egyes szó fogadásakor frissül.
- Az utolsó szakasz az „a” szó megérkezése után következik be. A neurális hálózat minden egyes angol szóhoz megad egy valószínűséget, amellyel a mondat befejezhető. Egy jól képzett RNN valószínűleg nagy valószínűséggel rendel a „kávézóhoz”, „ital”, „hamburgerhez” stb.
Az RNN általános használata
- Segítsen az értékpapír-kereskedőknek analitikus jelentéseket készíteni
- Határozzon meg eltéréseket a pénzügyi kimutatás szerződésében
- Hamis hitelkártya-tranzakció észlelése
- Adj feliratot a képekhez
- Power chatbotok
- Az RNN szabványos használata akkor fordul elő, amikor a szakemberek idősoros adatokkal vagy sorozatokkal (pl. hangfelvételekkel vagy szövegekkel) dolgoznak.
Konvolúciós ideghálózatok (CNN)
CNN egy többrétegű neurális hálózat, egyedi architektúrájával, amelyet úgy terveztek, hogy az egyes rétegeken lévő adatok egyre összetettebb jellemzőit kinyerje a kimenet meghatározásához. A CNN-k kiválóan alkalmasak észlelési feladatokra.
A CNN-t leginkább akkor használják, ha van egy strukturálatlan adatkészlet (pl. képek), és a szakembereknek információkat kell kinyerniük belőle.
Például, ha a feladat egy képfelirat megjóslása:
- A CNN kap egy képet mondjuk egy macskáról, ez a kép számítógépes kifejezéssel a pixel gyűjteménye. Általában egy réteg a szürkeárnyalatos képhez és három réteg a színes képhez.
- A jellemzők tanulása során (azaz rejtett rétegek) a hálózat egyedi jellemzőket azonosít, például a macska farkát, fülét stb.
- Amikor a hálózat alaposan megtanulta, hogyan kell felismerni egy képet, minden egyes általa ismert képhez megadhat egy valószínűséget. A legnagyobb valószínűséggel rendelkező címke lesz a hálózat előrejelzése.
Erősítő tanulás
Erősítő tanulás a gépi tanulás egy részterülete, amelyben a rendszereket virtuális „jutalmak” vagy „büntetések” elnyerésével képezik, lényegében próba és hiba útján. A Google DeepMind megerősítő tanulást használt, hogy legyőzze az emberi bajnokot a Go játékokban. A megerősítő tanulást a videojátékokban is használják a játékélmény javítására az intelligensebb robotok biztosításával.
Az egyik leghíresebb algoritmus:
- Q-learning
- Mély Q hálózat
- Állam-akció-jutalom-állam-akció (SARSA)
- Deep Deterministic Policy Gradient (DDPG)
Példák a mély tanulási alkalmazásokra
Most ebben a Mélytanulás kezdőknek oktatóanyagában ismerkedjünk meg a Deep Learning alkalmazásokkal:
AI a pénzügyekben
A pénzügyi technológiai szektor már megkezdte a mesterséges intelligencia használatát az időmegtakarítás, a költségek csökkentése és az értéknövelés érdekében. A mélyreható tanulás megváltoztatja a hitelezési ágazatot azáltal, hogy erőteljesebb kreditpontszámítást alkalmaz. A hitelezéssel kapcsolatos döntéshozók a mesterséges intelligencia segítségével robusztus hitelkölcsönzési kérelmeket készíthetnek, hogy gyorsabb, pontosabb kockázatértékelést érjenek el, a gépi intelligencia segítségével a kérelmezők jellemét és kapacitását figyelembe véve.
Az Underwrite egy Fintech vállalat, amely mesterséges intelligenciális megoldást kínál hitelkészítő cégek számára. Az underwrite.ai mesterséges intelligencia segítségével észleli, melyik kérelmező fizeti vissza nagyobb valószínűséggel a kölcsönt. Megközelítésük radikálisan felülmúlja a hagyományos módszereket.
AI a HR-ben
Az Armour alatt egy sportruházati cég forradalmasítja a munkaerő-felvételt, és modernizálja a jelöltek tapasztalatait az AI segítségével. Valójában az Under Armour 35%-kal csökkenti a kiskereskedelmi üzletek felvételi idejét. Az Under Armour iránt 2012-ben egyre nagyobb népszerűségnek örvendett. Átlagosan 30000 XNUMX önéletrajzuk volt havonta. Az összes jelentkezés elolvasása és a szűrési és interjúfolyamat megkezdése túl sokáig tartott. Az emberek felvételének és felvételének hosszadalmas folyamata befolyásolta az Under Armour azon képességét, hogy kiskereskedelmi üzleteiket teljes személyzettel, felpörgetett és működésre készen állják.
Abban az időben az Under Armour minden szükséges HR-technológiával rendelkezett, például tranzakciós megoldások beszerzéshez, alkalmazáshoz, nyomon követéshez és beépítéshez, de ezek az eszközök nem voltak elég hasznosak. Páncél alatt válassz HireVue, a HR-megoldások AI-szolgáltatója, igény szerinti és élő interjúkhoz egyaránt. Az eredmények blöffölőek voltak; sikerült 35%-kal csökkenteni a feltöltési időt. Cserébe a felvett magasabb színvonalú személyzet.
AI a marketingben
Az AI értékes eszköz az ügyfélszolgálat kezeléséhez és a személyre szabott kihívásokhoz. A mesterséges intelligencia technikák alkalmazásának köszönhetően a call-center-kezelésben és a hívásirányításban a továbbfejlesztett beszédfelismerés zökkenőmentesebb élményt tesz lehetővé az ügyfelek számára.
Például a hang mélyreható elemzése lehetővé teszi a rendszerek számára, hogy felmérjék az ügyfél érzelmi tónusát. Ha az ügyfél rosszul reagál a AI chatbot, a rendszer átirányíthatja a beszélgetést valódi, emberi operátorokhoz, akik átveszik a kérdést.
A fenti három mély tanulási példán kívül az AI-t széles körben használják más ágazatokban/iparágakban.
Miért fontos a mély tanulás?
A mélyreható tanulás hatékony eszköz arra, hogy az előrejelzést megvalósítható eredménnyel tegyük. A mély tanulás kiemelkedik a minták felfedezésében (felügyelet nélküli tanulás) és a tudásalapú előrejelzésben. Big adatok a mély tanulás üzemanyaga. Ha mindkettőt kombináljuk, egy szervezet példátlan eredményeket érhet el a termelékenység, az értékesítés, a menedzsment és az innováció terén.
A mély tanulás felülmúlhatja a hagyományos módszereket. Például a mélytanulási algoritmusok 41%-kal pontosabbak a gépi tanulási algoritmusoknál a képosztályozásban, 27%-kal pontosabbak az arcfelismerésben és 25%-kal a hangfelismerésben.
A mély tanulás korlátai
Ebben a neurális hálózati oktatóanyagban a Deep Learning korlátairól fogunk tanulni:
Adatok címkézése
A legtöbb jelenlegi AI-modellt „felügyelt tanuláson” keresztül képezik. Ez azt jelenti, hogy az embereknek meg kell címkézniük és kategorizálniuk a mögöttes adatokat, ami jelentős és tévedésre hajlamos házimunka lehet. Például az önvezető autós technológiákat fejlesztő vállalatok több száz embert vesznek fel, hogy manuálisan jegyezzenek fel több órányi videót a prototípus járművekről, hogy segítsék ezeknek a rendszereknek a képzését.
Szerezzen be hatalmas képzési adatkészleteket
Kimutatták, hogy az olyan egyszerű mély tanulási technikák, mint a CNN, bizonyos esetekben utánozhatják az orvostudomány és más területek szakértőinek tudását. A jelenlegi hullám gépi tanulásazonban olyan képzési adatkészleteket igényel, amelyek nemcsak címkézettek, hanem kellően szélesek és univerzálisak is.
A mélytanulási módszerek több ezer megfigyelést igényeltek ahhoz, hogy a modellek viszonylag jók legyenek az osztályozási feladatokban, és esetenként milliókra volt szükség ahhoz, hogy emberi szinten végezzenek. Meglepetés nélkül a mély tanulás híres az óriási technológiai cégeknél; nagy adatokat használnak petabájtnyi adat felhalmozására. Lehetővé teszi számukra, hogy lenyűgöző és rendkívül pontos mély tanulási modellt hozzanak létre.
Magyarázzon meg egy problémát
A nagy és összetett modelleket nehéz emberi értelemben megmagyarázni. Például, hogy miért hoztak egy adott határozatot. Ez az egyik oka annak, hogy egyes AI-eszközök elfogadása lassú azokon az alkalmazási területeken, ahol az értelmezhetőség hasznos vagy szükséges.
Ezen túlmenően, ahogy a mesterséges intelligencia alkalmazási köre bővül, a szabályozási követelmények is megmagyarázhatják az AI modellek iránti igényt.
Összegzésként
Mély tanulási áttekintés: A mély tanulás az új csúcstechnológia mesterséges intelligencia. A mélytanulási architektúra egy bemeneti rétegből, rejtett rétegekből és egy kimeneti rétegből áll. A mély szó azt jelenti, hogy kettőnél több teljesen összefüggő réteg van.
Hatalmas mennyiségű neurális hálózat létezik, ahol minden architektúra egy adott feladat elvégzésére van kialakítva. Például a CNN nagyon jól működik képekkel, az RNN lenyűgöző eredményeket nyújt idősorokkal és szövegelemzéssel.
A mélyreható tanulás jelenleg különböző területeken aktív, a pénzügyektől a marketingig, az ellátási láncig és a marketingig. A nagy cégek az elsők, amelyek mély tanulást alkalmaznak, mivel már nagy mennyiségű adattal rendelkeznek. A mély tanuláshoz kiterjedt képzési adatkészletre van szükség.


