0% acharam este documento útil (0 voto)
16 visualizações5 páginas

Deep Learning

Enviado por

AHFV
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
16 visualizações5 páginas

Deep Learning

Enviado por

AHFV
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd

CAPÍTULO 3 – Deep learning

A revolução na IA

Diferenças entre deep learning e machine learning

Considere o seguimento exemplo: suponha que tenhamos fotos de


milhares de animais e queremos criar um algoritmo para encontrar os cavalos.
Bem, machine learning não pode analisar as fotos em si; em vez disso, os
dados devem ser rotulados. O algoritmo de machine learning será treinado
para reconhecer cavalos por meio de um processo conhecido como
aprendizagem supervisionada (TAULLI, 2020, p. 97).

Para fazer isso com machine learning, no entanto, é preciso usar um


processo chamado extração de recursos. Isso significa que será necessário
imaginar os tipos das características de um cavalo que os algoritmos tentarão
então identificar – tal como forma, casco, cor e altura (TAULLI, 2020, p. 97).

Com deep learning, entretanto, é possível resolver esses problemas.


Essa abordagem analisa todos os dados – pixel por pixel – e, em seguida,
encontra as relações usando uma rede neural que imita o cérebro humano
(TAULLI, 2020, p. 97).

Afinal, o que é deep learning então?

A tecnologia deep learning é uma subárea do machine learning. Esse


tipo de sistema permite o processamento de enormes quantidades de dados
para encontrar relacionamentos e padrões que os seres humanos são muitas
vezes incapazes de detectar. A palavra “deep” (em português, “profundo”)
refere-se ao número de camadas ocultas na rede neural, as quais fornecem
grande parte do poder de aprendizagem (TAULLI, 2020, p. 98).

As diferentes redes neurais

A rede neural totalmente conectada é o tipo mais básico que existe.


Como o nome indica, nela todos os neurônios têm conexões de uma camada
para a outra. Essa rede é bastante popular, uma vez que demanda pouca
capacidade crítica na criação do modelo (TAULLI, 2020, p. 103).

E quais são, então, algumas das outras redes neurais? As mais comuns
incluem: rede neural recorrente (RNN), rede neural convolucional (CMN) e rede
adversária generativa (GAN – Generative Adversarial Networks), sobre as
quais falaremos a seguir (TAULLI, 2020, p. 103).

Aplicações de deep learning

-Estudos de caso: Terremotos

O mais importante, contudo, é melhorar a coleta de dados. Isso significa


uma quantidade maior de análise de pequenos terremotos (na Califórnia, há
uma média de 50 por dia). O objetivo é criar um catálogo de terremotos que
viabilize a criação de um sismólogo virtual capaz de fazer avaliações do
fenômeno mais rápido do que um ser humano. Isso poderia permitir a
antecipação da chegada de um terremoto, o que pode ajudar a salvar vidas e
propriedades (TAULLI, 2020, p. 110).

Desvantagem do deep learning

Veja algumas das preocupações do autor com relação ao deep learning:


(TAULLI, 2020, p. 116)

Caixa preta: um modelo de deep learning pode facilmente ter milhões de


parâmetros que envolvem muitas camadas ocultas. Ter uma compreensão
clara disso está realmente além das capacidades de uma pessoa. É verdade
que essa característica pode não ser necessariamente um problema no
reconhecimento de gatos em um conjunto de dados, mas poderia
definitivamente ser um empecilho em modelos para diagnóstico médico ou
determinação da segurança de uma plataforma de pétroleo. Nessas situações,
reguladores vão precisar de uma boa compreensão da transparência dos
modelos. Devido ao isso, pesquisadores buscam criar sistemas para
determinar a “explicabilidade”, que fornece uma compreensão dos modelos de
deep learning.

Dados: o cérebro humano tem suas falhas. Contudo, há algumas


funções que ele desempenha muito bem, como a capacidade de aprender por
abstração. Por exemplo, suponha que Jan tem cinco anos de idade, vai a um
restaurante com a família. Sua mãe aponta um item no prato e diz que é um
“taco”. Não há necessidade de explicá-lo ou fornecer qualquer informação
adicional sobre o alimento. Em vez disso, o cérebro de Jan vai processar
instantaneamente as informações e assimilar o padrão geral. No futuro, quando
vir outro taco – mesmo que ele apresente diferenças, como um molho –, ela vai
saber o que é. Para a maioria das pessoas, isso é intuitivo. Infelizmente,
contudo, quando se trata de deep learning não há aprendizagem sobre tacos
por meio de abstração! O sistema tem de processar enormes quantidades de
dados para reconhecê-los. Claro, isso não é um problema para organizações
como Facebook, Google ou mesmo Uber. No entanto, muitas empresas têm
conjunto de dados muito mais limitados. O resultado é que deep learning pode
não ser uma boa opção.

Estrutura hierárquica: essa forma de organização não existe no deep


learning. Devido a isso, a compreensão da linguagem ainda tem um longo
caminho a percorrer (especialmente com longas discussões).

Inferência aberta: Marcus observa que o deep learning não consegue


entender as nuances entre “John promised Mary to leave” (“John prometeuque
Maria iria embora”) e “John promised to leave Mary” (“John prometeu deixar
Maria”). Além do mais, deep learning está longe de ser capaz de, por exemplo,
ler Orgulho e Preconceito, de Jane Austen, e e identificar as motivações de
caráter de Elizabeth Bennet.

Pensamento conceitual: deep learning, não consegue compreender


conceitos como democracia, justiça ou felicidade. Também não tem
imaginação e, portanto, não concebe novas ideias ou planos.

Senso comum: isso é algo que deep learning não faz bem; o que
significa que um modelo pode ser facilmente confundido. Por exemplo, se você
perguntar a um sistema de IA algo como: “é possível fazer um computador com
uma esponja?”, ele provavelmente não vai saber que essa é uma pergunta
ridícula.

Causalidade: deep learning é incapaz de determiná-la. Tudo se resume


a encontrar correlações.

Conhecimento prévio: CNNs podem ajudar com algumas informações


anteriores, mas isso é limitado. O deep learning, ainda é bastane restrito, já
que só resolve um problema por vez. Ele não consegue, por exemplo, pegar os
dados e criar algoritmos que abranjam vários domínios. Além disso, um modelo
não se adapta. Se houver alteração nos dados, então um novo modelo
precisará ser treinado e testado. Por fim, deep learning não tem compreensão
prévia do que as pessoas sabem instintivamente – como a física básica do
mundo real. Isso é algo que tem de ser explicitamente programado em um
sistema de IA.

Estatística: deep learning funciona melhor em ambientes simples. É por


isso que a IA vem sendo tão eficaz em jogos de tabuleiro, que contam com um
conjunto de regras e limites. O mundo real, entretanto, é caótico e imprevisível.
Isso significa que o deep learning pode não dar conta de problemas complexos,
mesmo em carros autônomos.

Recursos: Um modelo de deep learning muitas vezes requer uma


enorme quantidade de energia da CPU, como é o caso das GPUs. Isso pode
ficar caro. Uma opção, no entanto, é usar um serviço de nuvem de terceiros.

Isso é muito? Com certeza, mas o artigo ainda deixou de fora algumas
desvantagens. Aqui estão elas:

Efeito borboleta: devido à complexidade de dados, redes e conexões,


uma pequena alteração pode causar grande impacto nos resultados do modelo
de deep learning. Isso poderia facilmente levar a conclusões erradas ou
enganosas.

Superadaptação (Overfitting): explicamos esse conceito no início do


capítulo.

Quanto a Marcus, seu maior medo é que a IA possa “ficar presa a um


mínimo, habitando na parte errada do espaço intelectual, concentrando-se
demais na exploração detalhada de um determinada classe de modelos
acessíveis, embora limitados, voltados ao tratamento de problemas simples –
potencialmente negligenciando aventuras mais arriscadas que podem levar a
caminhos mais robustos” (TAULLI, 2020, p. 118).

No entanto, o estudioso não é pessimista. Ele acredita que os


pesquisadores precisam ir além do deep learning para encontrar novas
técnicas que possam resolver problemas difíceis (TAULLI, 2020, p. 118).

Principais aprendizados (TAULLI, 2020, p. 119).

Deep learning, uma subárea de machine learning, processa grandes


quantidades de dados para detectar relacionamentos e padrões que os seres
humanos são muitas vezes incapazes de perceber. A palavra “deep”
(“profundo”) refere-se ao número de camadas ocultas.

Uma rede neural artificial (ANN) é uma função que inclui unidades que
têm pesos e são usadas para prever valores em um modelo de IA.

Uma camada oculta é parte de um modelo que processa os dados de


entrada.

Uma rede neural recorrente (RNN) é uma função que não só processa
uma entrada, mas também todas as anteriores informadas ao longo do tempo.

Uma rede neural convolucional (CNN) analisa os dados seção por seção
(ou seja, por convoluções). Esse modelo é voltado para aplicações complexas,
como reconhecimento de imagem.

Uma rede adversária generativa ou GAN é onde duas redes neurais


competem entre si em um ciclo de feedback apertado. O resultado é muitas
vezes a criação de um novo objeto.

Você também pode gostar