Tutorial sul deep learning per principianti: nozioni di base sulla rete neurale
Cos'รจ l'apprendimento profondo?
Deep Learning รจ un software per computer che imita la rete di neuroni del cervello. ร un sottoinsieme dell'apprendimento automatico basato su reti neurali artificiali con apprendimento per rappresentazione. Si chiama deep learning perchรฉ fa uso di reti neurali profonde. Questo apprendimento puรฒ essere supervisionato, semi-supervisionato o non supervisionato.
Gli algoritmi di deep learning sono costruiti con livelli connessi.
- Il primo livello รจ chiamato Livello di input
- L'ultimo livello รจ chiamato Livello di output
- Tutti i livelli intermedi sono chiamati Livelli nascosti. La parola profondo significa che la rete unisce i neuroni in piรน di due strati.

Ogni strato nascosto รจ composto da neuroni. I neuroni sono collegati tra loro. Il neurone elaborerร e quindi propagherร il segnale di ingresso che riceve allo strato sopra di esso. La forza del segnale inviato al neurone nello strato successivo dipende dal peso, dalla polarizzazione e dalla funzione di attivazione.
La rete consuma grandi quantitร di dati di input e li gestisce attraverso piรน livelli; a ogni livello la rete puรฒ apprendere caratteristiche sempre piรน complesse dei dati.
Processo di apprendimento profondo
Una rete neurale profonda fornisce una precisione all'avanguardia in molte attivitร , dal rilevamento di oggetti al riconoscimento vocale. Possono apprendere automaticamente, senza conoscenze predefinite codificate esplicitamente dai programmatori.

Per comprendere l'idea di apprendimento profondo, immagina una famiglia con un neonato e i genitori. Il bambino piccolo indica gli oggetti con il mignolo e dice sempre la parola "gatto". Poichรฉ i genitori sono preoccupati per la sua istruzione, continuano a dirgli "Sรฌ, รจ un gatto" o "No, non รจ un gatto". Il neonato continua a indicare gli oggetti ma diventa piรน preciso con "gatti". Il bambino piccolo, in fondo, non sa perchรฉ puรฒ dire che รจ un gatto o no. Ha appena imparato a gerarchizzare caratteristiche complesse arrivando a un gatto guardando l'animale domestico nel suo complesso e continua a concentrarsi su dettagli come la coda o il naso prima di decidere.
Una rete neurale funziona piรน o meno allo stesso modo. Ogni strato rappresenta un livello di conoscenza piรน profondo, ovvero la gerarchia della conoscenza. Una rete neurale con quattro strati apprenderร caratteristiche piรน complesse rispetto a una con due strati.
Lโapprendimento avviene in due fasi:
Prima fase: La prima fase consiste nell'applicare una trasformazione non lineare dell'input e creare un modello statistico come output.
Seconda fase: La seconda fase mira a migliorare il modello con un metodo matematico noto come derivata.
La rete neurale ripete queste due fasi da centinaia a migliaia di volte finchรฉ non raggiunge un livello di precisione tollerabile. La ripetizione di queste due fasi รจ chiamata iterazione.
Per fornire un esempio di deep learning, dai un'occhiata al movimento qui sotto, il modello sta cercando di imparare a ballare. Dopo 10 minuti di allenamento, la modella non sa ballare e sembra uno scarabocchio.
Dopo 48 ore di apprendimento, il computer padroneggia l'arte della danza.
Classificazione delle reti neurali
Rete neurale superficiale: La rete neurale superficiale ha solo uno strato nascosto tra l'input e l'output.
Rete neurale profonda: Le reti neurali profonde hanno piรน di uno strato. Ad esempio, il modello Google LeNet per il riconoscimento delle immagini conta 22 livelli.
Al giorno d'oggi, il deep learning viene utilizzato in molti modi, come un'auto senza conducente, un telefono cellulare, il motore di ricerca di Google, il rilevamento di frodi, la TV e cosรฌ via.
Tipi di reti di deep learning
Ora in questo tutorial sulla rete neurale profonda, impareremo i tipi di reti di deep learning:

Reti neurali feed-forward
Il tipo piรน semplice di rete neurale artificiale. Con questo tipo di architettura, le informazioni fluiscono in una sola direzione, in avanti. Ciรฒ significa che i flussi di informazioni iniziano allo strato di input, vanno agli strati "nascosti" e terminano allo strato di output. La rete
non ha un ciclo. Le informazioni si fermano ai livelli di output.
Reti neurali ricorrenti (RNN)
RNN รจ una rete neurale multistrato che puรฒ memorizzare informazioni in nodi di contesto, consentendole di apprendere sequenze di dati e di produrre un numero o un'altra sequenza. In parole semplici, รจ una rete neurale artificiale le cui connessioni tra neuroni includono loop. Le RNN sono adatte per l'elaborazione di sequenze di input.

Ad esempio, se il compito รจ prevedere la parola successiva nella frase โVuoi unโฆโฆโฆโฆ?
- I neuroni RNN riceveranno un segnale che punta all'inizio della frase.
- La rete riceve la parola "Do" come input e produce un vettore del numero. Questo vettore viene restituito al neurone per fornire una memoria alla rete. Questa fase aiuta la rete a ricordare di aver ricevuto il "Do" e di averlo ricevuto in prima posizione.
- La rete procederร allo stesso modo con le parole successive. Ci vuole la parola "tu" e "vuoi". Lo stato dei neuroni viene aggiornato dopo aver ricevuto ogni parola.
- La fase finale avviene dopo aver ricevuto la parola โaโ. La rete neurale fornirร una probabilitร per ogni parola inglese che puรฒ essere utilizzata per completare la frase. Una RNN ben addestrata probabilmente assegna unโalta probabilitร a โcafรฉโ, โdrinkโ, โburgerโ, ecc.
Usi comuni di RNN
- Aiuta i trader di titoli a generare report analitici
- Rilevare anomalie nel contratto di bilancio
- Rileva transazioni fraudolente con carta di credito
- Fornire una didascalia per le immagini
- Chatbot potenti
- Gli usi standard di RNN si verificano quando i professionisti lavorano con dati o sequenze di serie temporali (ad esempio, registrazioni audio o testo).
Reti neurali convoluzionali (CNN)
CNN รจ una rete neurale multistrato con un'architettura unica progettata per estrarre caratteristiche sempre piรน complesse dei dati a ogni livello per determinare l'output. Le CNN sono adatte per compiti percettivi.
La CNN viene utilizzata principalmente quando รจ presente un set di dati non strutturati (ad esempio, immagini) e i professionisti devono estrarre informazioni da esso.
Ad esempio, se l'attivitร รจ prevedere la didascalia di un'immagine:
- La CNN riceve un'immagine, diciamo, di un gatto, questa immagine, in termini informatici, รจ una raccolta di pixel. Generalmente, uno strato per l'immagine in scala di grigi e tre strati per un'immagine a colori.
- Durante l'apprendimento delle caratteristiche (ovvero i livelli nascosti), la rete identificherร caratteristiche uniche, ad esempio la coda del gatto, l'orecchio, ecc.
- Quando la rete ha imparato a fondo come riconoscere un'immagine, puรฒ fornire una probabilitร per ogni immagine che conosce. L'etichetta con la probabilitร piรน alta diventerร la previsione della rete.
Insegnamento rafforzativo
Insegnamento rafforzativo รจ un sottocampo dellโapprendimento automatico in cui i sistemi vengono addestrati ricevendo โpremiโ o โpunizioniโ virtuali, imparando essenzialmente per tentativi ed errori. DeepMind di Google ha utilizzato l'apprendimento per rinforzo per battere un campione umano nei giochi Go. L'apprendimento per rinforzo viene utilizzato anche nei videogiochi per migliorare l'esperienza di gioco fornendo bot piรน intelligenti.
Uno degli algoritmi piรน famosi sono:
- Q-apprendimento
- Rete Q profonda
- Stato-Azione-Ricompensa-Stato-Azione (SARSA)
- Gradiente politico deterministico profondo (DDPG)
Esempi di applicazioni di deep learning
Ora in questo tutorial sul Deep Learning per principianti, impariamo a conoscere le applicazioni di Deep Learning:
L'intelligenza artificiale nella finanza
Il settore della tecnologia finanziaria ha giร iniziato a utilizzare lโintelligenza artificiale per risparmiare tempo, ridurre i costi e aggiungere valore. Il deep learning sta cambiando il settore dei prestiti utilizzando un punteggio di credito piรน solido. I decisori del credito possono utilizzare lโintelligenza artificiale per solide applicazioni di prestito di credito per ottenere una valutazione del rischio piรน rapida e accurata, utilizzando lโintelligenza artificiale per tenere conto del carattere e della capacitร dei richiedenti.
Underwrite รจ una societร Fintech che fornisce una soluzione di intelligenza artificiale per le aziende produttrici di credito. underwrite.ai utilizza l'intelligenza artificiale per rilevare quale richiedente ha maggiori probabilitร di rimborsare un prestito. Il loro approccio supera radicalmente i metodi tradizionali.
IA nelle risorse umane
Under Armour, un'azienda di abbigliamento sportivo, rivoluziona le assunzioni e modernizza l'esperienza dei candidati con l'aiuto dell'intelligenza artificiale. Infatti, Under Armour riduce i tempi di assunzione per i suoi negozi al dettaglio del 35%. Under Armour ha riscontrato un crescente interesse in termini di popolaritร nel 2012. Avevano, in media, 30000 curriculum al mese. Leggere tutte quelle candidature e iniziare il processo di selezione e colloquio stava richiedendo troppo tempo. Il lungo processo per assumere e integrare le persone ha avuto un impatto sulla capacitร di Under Armour di avere i propri negozi al dettaglio completamente attrezzati, attrezzati e pronti a funzionare.
A quel tempo, Under Armour disponeva di tutte le tecnologie HR "indispensabili", come soluzioni transazionali per l'approvvigionamento, la candidatura, il monitoraggio e l'onboarding, ma tali strumenti non erano abbastanza utili. Sotto l'armatura scegli HireVue, un fornitore di intelligenza artificiale per soluzioni HR, sia per colloqui on-demand che dal vivo. I risultati erano bluff; sono riusciti a diminuire del 35% il tempo di riempimento. In cambio, il personale assunto รจ di qualitร superiore.
AI nel marketing
Lโintelligenza artificiale รจ uno strumento prezioso per la gestione del servizio clienti e le sfide di personalizzazione. Il miglioramento del riconoscimento vocale nella gestione dei call center e nell'instradamento delle chiamate come risultato dell'applicazione delle tecniche di intelligenza artificiale consente un'esperienza piรน fluida per i clienti.
Ad esempio, l'analisi dell'audio con deep learning consente ai sistemi di valutare il tono emotivo di un cliente. Se il cliente risponde male al AI chatbot, il sistema puรฒ reindirizzare la conversazione a operatori umani reali che si occupano della questione.
A parte i tre esempi di deep learning sopra riportati, lโintelligenza artificiale รจ ampiamente utilizzata in altri settori/industrie.
Perchรฉ รจ importante il deep learning?
Il deep learning รจ uno strumento potente per rendere la previsione un risultato utilizzabile. Il deep learning eccelle nella scoperta di modelli (apprendimento non supervisionato) e nella previsione basata sulla conoscenza. Big dati รจ il carburante per l'apprendimento profondo. Quando entrambi sono combinati, un'organizzazione puรฒ raccogliere risultati senza precedenti in termini di produttivitร , vendite, gestione e innovazione.
Il deep learning puรฒ superare il metodo tradizionale. Ad esempio, gli algoritmi di deep learning sono piรน accurati del 41% rispetto allโalgoritmo di machine learning nella classificazione delle immagini, del 27% piรน accurati nel riconoscimento facciale e del 25% nel riconoscimento vocale.
Limitazioni dell'apprendimento profondo
Ora in questo tutorial sulla rete neurale impareremo le limitazioni del Deep Learning:
Etichettatura dei dati
La maggior parte degli attuali modelli di intelligenza artificiale vengono addestrati tramite โapprendimento supervisionatoโ. Ciรฒ significa che gli esseri umani devono etichettare e classificare i dati sottostanti, il che puรฒ essere un compito considerevole e soggetto a errori. Ad esempio, le aziende che sviluppano tecnologie per auto a guida autonoma stanno assumendo centinaia di persone per annotare manualmente ore di feed video provenienti da veicoli prototipo per aiutare ad addestrare questi sistemi.
Ottieni enormi set di dati di addestramento
ร stato dimostrato che semplici tecniche di deep learning come la CNN possono, in alcuni casi, imitare la conoscenza di esperti in medicina e in altri campi. L'attuale ondata di machine learning, tuttavia, richiede set di dati di addestramento che non siano solo etichettati ma anche sufficientemente ampi e universali.
I metodi di deep learning hanno richiesto migliaia di osservazioni affinchรฉ i modelli diventassero relativamente efficaci nei compiti di classificazione e, in alcuni casi, milioni affinchรฉ potessero essere eseguiti al livello degli esseri umani. Senza sorpresa, il deep learning รจ famoso nelle grandi aziende tecnologiche; stanno utilizzando i big data per accumulare petabyte di dati. Consente loro di creare un modello di deep learning impressionante e altamente accurato.
Spiega un problema
I modelli grandi e complessi possono essere difficili da spiegare, in termini umani. Ad esempio, perchรฉ รจ stata presa una particolare decisione. ร uno dei motivi per cui l'accettazione di alcuni strumenti di IA รจ lenta in aree applicative in cui l'interpretabilitร รจ utile o addirittura richiesta.
Inoltre, con lโespansione dellโapplicazione dellโintelligenza artificiale, i requisiti normativi potrebbero anche guidare la necessitร di modelli di intelligenza artificiale piรน spiegabili.
Sintesi
Panoramica sull'apprendimento profondo: Il deep learning รจ il nuovo stato dell'arte per intelligenza artificiale. L'architettura di apprendimento profondo รจ composta da un livello di input, livelli nascosti e un livello di output. La parola profondo significa che ci sono piรน di due livelli completamente connessi.
Esiste una vasta quantitร di reti neurali, in cui ogni architettura รจ progettata per svolgere un dato compito. Ad esempio, la CNN funziona molto bene con le immagini, la RNN fornisce risultati impressionanti con serie temporali e analisi del testo.
Il deep learning รจ ora attivo in diversi campi, dalla finanza al marketing, alla supply chain e al marketing. Le grandi aziende sono le prime a utilizzare il deep learning perchรฉ dispongono giร di un ampio pool di dati. Il deep learning richiede la disponibilitร di un ampio set di dati di addestramento.


