00:00:04
Olá pessoal, tudo bem? Meu nome é
00:00:06
Luciano Soler, serei o professor de
00:00:08
vocês na disciplina de inteligência
00:00:09
artificial. Vou fazer uma breve
00:00:11
autodescrição. Eu sou um homem branco de
00:00:13
cabelo castanho escuro, vestindo uma
00:00:16
camiseta preta. Eu tô num cenário que o
00:00:18
fundo é preto com alguns livros, uma
00:00:21
mesa preta e um computador ao lado.
00:00:23
Inteligência artificial, módulo um,
00:00:26
introdução à inteligência artificial
00:00:29
três, pessoal.
00:00:31
Então, toda a parte de inteligência
00:00:33
artificial, como que os computadores
00:00:35
aprendem? Como que a gente ensina pro
00:00:38
computador vídeos, imagens e tudo mais?
00:00:41
Como que isso é feito? né? Nós pegamos
00:00:43
um monte de arquivos, pode ser texto,
00:00:45
pode ser imagem, pode ser vídeo, pode
00:00:46
ser áudio. A gente, quando a gente
00:00:48
coloca na inteligência artificial, tudo
00:00:50
isso é transformado em números e esses
00:00:53
números são processados ali pelo
00:00:56
algoritmo inteligente, pela rede neural,
00:00:58
e são devolvidos como números. Só que
00:01:00
esses números devolvidos são
00:01:03
retransformados em áudio, vídeo, texto.
00:01:06
A gente consegue fazer as entradas do
00:01:08
jeito que a gente precisa e ter uma
00:01:10
resposta do jeito que a gente precisa. E
00:01:12
no meio a gente tem programas
00:01:14
inteligentes que processam, assim como o
00:01:17
nosso cérebro, a gente recebe
00:01:19
informações visuais,
00:01:22
auditivas, textuais e a gente consegue
00:01:25
processar aquilo ali e gerar o resultado
00:01:27
de acordo com e o o que a gente recebeu.
00:01:30
Então, a rede neural é a mesma coisa.
00:01:32
Vamos ver um exemplo. Por exemplo, se eu
00:01:34
pego essa imagem, quando eu jogo essa
00:01:37
imagem da vaca, que a gente tem à
00:01:38
esquerda aqui, uma imagem de vaca com um
00:01:40
focinho bem próximo da câmera, quando eu
00:01:43
pego essa imagem da vaca com o focinho
00:01:47
bem próximo da câmera e jogo na rede
00:01:50
neural, a gente tá transformando essa
00:01:52
imagem em números. Essa rede neural que
00:01:54
parece um cérebro cheio de número lá
00:01:55
dentro, tá processando isso. E a saída
00:01:59
são números, mas que também depois podem
00:02:01
virar texto, podem virar áudio. E essa
00:02:05
saída pode virar áudio. Nesse caso aqui,
00:02:08
teve a saída ali que a gente viu, ó, a
00:02:09
imagem que você forneceu é uma vaca
00:02:11
vista de muito perto. Se nós colocarmos
00:02:14
isso na inteligência artificial, a gente
00:02:15
vai ter isso, ó. Se você fizer isso no
00:02:16
chat EPT agora, se você, a gente vai
00:02:19
falar um pouquinho mais sobre o chat
00:02:20
EPT, mas vou mostrar um vídeo aqui. Se
00:02:22
você colocar essa imagem no chat EPT e
00:02:25
apertar para enviar lá para ele, ele vai
00:02:27
responder justamente isso, ó. Essa essa
00:02:29
imagem é de uma vaca vista de muito
00:02:32
perto, se destaca pelo focinho grande,
00:02:34
expressivo. Ele tá explicando para você
00:02:36
o que que é aquela imagem. Isso, ela
00:02:40
recebeu aquele aquela imagem, processou
00:02:43
e nos retornou de uma forma
00:02:46
diferenciada, tá? Solar, mas como que
00:02:49
esses computadores aprendem, né? Você me
00:02:52
falou ali que você vai colocar vários
00:02:54
arquivos e vai processar aquilo e vai
00:02:57
ter uma uma volta. Mas exatamente como
00:03:00
como que você ensina para ele? A gente
00:03:03
tem três tipos de formas de aprendizado
00:03:05
do computador. A gente tem o aprendizado
00:03:08
supervisionado, que a gente vai falar
00:03:10
como que funciona o aprendizado na
00:03:12
primeiro degrau aqui, né? Vamos pensar
00:03:14
assim que a gente tem uma imagem aqui,
00:03:15
nós temos três degrais, né? o
00:03:18
aprendizado supervisionado no primeiro
00:03:21
degrau, o segundo degrau é aprendizado
00:03:23
não supervisionado e o terceiro degrau
00:03:26
aprendizado por
00:03:28
reforço. Essa imagem que a gente tá
00:03:29
vendo, a gente pode imaginar ali o
00:03:31
primeiro degrau. Vamos falar um
00:03:32
pouquinho desse primeiro degrau
00:03:33
inicialmente. O que que é o aprendizado
00:03:35
supervisionado? O aprendizado
00:03:37
supervisionado é quando você acompanha o
00:03:40
computador no aprendizado dele. Vamos
00:03:42
pro próximo slide. Aqui a gente vai ver
00:03:44
um exemplo bem claro disso. Aqui a gente
00:03:46
tem uma imagem de um inseto. Ele chama é
00:03:49
um conhecido como percevejo, mas chama
00:03:52
euquistos. Eh, nesara virdula, né? Na
00:03:56
verdade, chama Nesara
00:03:58
virdula. Esse perceve e eu tenho para
00:04:01
mim fazer com que o computador reconheça
00:04:04
esse perceve, eu tenho que fazer uma
00:04:06
marcação nessa imagem, que essa imagem
00:04:08
de perceve que a gente tá vendo, eu
00:04:10
tenho que marcar um retângulo em volta
00:04:11
da imagem. Então, se você olhar, tem um
00:04:14
retângulo marcado em volta da imagem de
00:04:17
Percevejo. Esse retângulo, ele vai fazer
00:04:20
com que o computador entenda que aquela
00:04:22
área é uma área prioritária dentro da
00:04:24
imagem e que ele tem que aprender sobre
00:04:26
aquela área. Eu tenho que fazer isso
00:04:29
igual eu vou passar aqui o próximo
00:04:30
slide. Vocês estão vendo que tem muitas
00:04:32
imagens. A gente tem aqui nesse slide eh
00:04:35
um
00:04:36
site chama Roboflow. E esse site você
00:04:39
pode jogar as imagens para treinamento.
00:04:41
Então você joga várias imagens lá dentro
00:04:43
desse site aqui. A gente tá vendo várias
00:04:45
imagens. É um conjunto de imagens aqui.
00:04:48
E essas imagens todas elas eu tenho que
00:04:51
marcar uma por uma. Se você observar
00:04:54
nesse site que a gente tá olhando, eh,
00:04:56
são
00:04:57
7.263 imagens. São muitas imagens, né? E
00:05:01
e daí você tem que marcar todas as
00:05:03
imagens de todos os insetos.
00:05:06
É todo o mesmo, todas as imagens é do
00:05:08
mesmo inseto, porque eu tô treinando
00:05:09
inteligência artificial neste tipo de
00:05:12
inseto. Se eu quiser treinar para outra
00:05:14
coisa, quiser treinar para ele
00:05:15
reconhecer carros, eu teria que ter
00:05:17
imagens do carro, dos carros ou do
00:05:19
carro, se for um modelo específico, em
00:05:22
diversas posições diferente para que ele
00:05:24
reconheça aquele carro em qualquer
00:05:26
posição. O caso aqui das imagens do
00:05:29
Percevejo, eu tô estou treinando ela de
00:05:33
várias maneiras diferentes. Veja em
00:05:35
posições diferentes com idades
00:05:36
diferentes, porque o os insetos eles
00:05:39
mudam, igual a gente muda na nossa
00:05:41
idade, os insetos também mudam. Então a
00:05:42
gente tem que colocar várias imagens de
00:05:44
formas diferentes pra inteligência
00:05:45
artificial conseguir reconhecer. É um
00:05:48
trabalho manual que a gente faz para
00:05:50
treinar ela. Isso daqui é o aprendizado
00:05:52
supervisionado, porque a gente ensina
00:05:54
passando exatamente o que a gente quer
00:05:55
que ela aprenda. Eu não vou colocar uma
00:05:57
imagem de um outro inseto, por exemplo,
00:05:59
de uma formiga aqui, porque senão eu vou
00:06:01
treinar errado a inteligência
00:06:02
artificial.
00:06:04
eu tenho que marcar exatamente o que eu
00:06:06
quero que ela saiba. Então, nesse caso,
00:06:07
é um aprendizado
00:06:08
supervisionado. Eu tenho no segundo
00:06:10
degrau agora, voltando aqui para aquela
00:06:12
nossa nossa imagem que tem o os três
00:06:15
degrais n aprendizado supervisionado,
00:06:17
não supervisionado e por reforço, a
00:06:19
gente vai falar do aprendizado não
00:06:20
supervisionado. O que que o aprendizado
00:06:22
não supervisionado traz? O aprendizado
00:06:24
não supervisionado, ele faz o tal da que
00:06:26
a gente chama de classificação. Vamos
00:06:28
pro próximo slide aqui, fica mais fácil.
00:06:30
Eu só tenho vários objetos, objetos
00:06:32
diferentes. Então a gente tá pegando
00:06:33
frutas aqui. Então olhando pro lado
00:06:34
esquerdo, a gente tem várias frutas ali,
00:06:36
maçã, banana, eh eh pêssego. São várias
00:06:41
frutas diferentes, desculpa, maçã,
00:06:42
banana e
00:06:43
laranja. São várias frutas diferentes.
00:06:45
Ali a gente tem várias frutas
00:06:47
diferentes. Do lado esquerdo a gente tem
00:06:49
um cérebro com processamento e do lado
00:06:51
direito a gente vai ver três fileiras de
00:06:53
frutas, né? a gente vê maçã na primeira
00:06:55
fileira, na segunda fileira a gente vê
00:06:57
eh laranja e na última fileira a gente
00:06:59
vê banana. Que que acontece ali? a
00:07:01
gente, esse algoritmo de eh aprendizado
00:07:04
não supervisionado, ele consegue
00:07:05
reconhecer padrões diferentes. Então ele
00:07:08
observa vários várias coisas misturado e
00:07:10
consegue separar eles, que a gente chama
00:07:11
de classificação. Então, de acordo com o
00:07:13
comportamento, de acordo com o
00:07:16
o a cor, no caso, o cor e forma do
00:07:19
objeto, de acordo com a idade, a gente
00:07:22
consegue fazer esse tipo de
00:07:23
classificação. O próprio Netflix faz,
00:07:25
ele analisa o seu padrão de acordo com o
00:07:27
padrão de comportamento. a pessoa gosta
00:07:28
de filmes de ação, eu vou começar a
00:07:31
mostrar para ela mais filmes de ação
00:07:32
nesse estilo. Então é assim que a gente
00:07:33
trabalha com classificação,
00:07:36
né? E aqui a gente tem, por exemplo, o
00:07:38
exemplo da classificação. Classificação
00:07:40
a gente consegue separar e clusterização
00:07:42
a gente consegue também. É um tipo de
00:07:44
classificação diferenciada a gente pode
00:07:46
classificar, separar todos os bichos, um
00:07:48
separado, tipo, todas as galinhas, todos
00:07:50
os patos, todos os galos, né? E
00:07:53
separados. E a gente também pode eh na
00:07:56
classificação e também na clusterização
00:07:58
a gente pode separar mamíferos de aves,
00:07:59
por exemplo, é um cluster, é um conjunto
00:08:01
maior ali da
00:08:03
classificação. E por último, não menos
00:08:06
importante, a gente tem também o
00:08:07
aprendizado por reforço. Que que é
00:08:09
aprendizado por reforço? Aprendizado por
00:08:10
reforço é quando você ensina e você dá
00:08:14
pontos quando a inteligência aprende e
00:08:16
pune quando ela não
00:08:18
aprende. No último degrau aqui, a gente
00:08:20
vê ali uma pessoa ensinando um cachorro,
00:08:23
né? Ela ela vai jogar uma um um alguma
00:08:26
coisa pro cachorro, se ele devolver de
00:08:28
volta para ela, ele ganha algum algum
00:08:33
petisco. Ver um exemplo aqui também de
00:08:35
aprendizado por reforço. N nessa imagem
00:08:37
que a gente tá vendo na tela, do lado
00:08:40
direito, nós temos ali as ações que
00:08:43
temos para fazer e do lado esquerdo nós
00:08:45
temos o robô. Temos um robô bem no meio
00:08:49
da tela. Temos três linhas. A primeira
00:08:51
linha, a gente tem um robô bem no meio
00:08:53
da tela, que é o nosso agente, e ele tá
00:08:55
em um meio. Que que significa isso? Ele
00:08:58
tem um meio e ele tem duas opções
00:09:00
naquele meio. Do lado
00:09:02
direito, ele tem uma torneira com água e
00:09:06
um balde. E do lado esquerdo, ele tem o
00:09:09
fogo. Se nós falarmos para esse agente
00:09:11
que ele tem que resolver o problema, o
00:09:14
que que ele vai fazer? Pode ser que ele
00:09:16
vá igual na segunda linha, direto pro
00:09:18
fogo, porque o fogo é o problema. Se
00:09:21
isso acontecer, igual nós estamos vendo,
00:09:23
ele pode se queimar ali, né? Pode ter
00:09:26
problema. Então ele vai perder pontos
00:09:28
caso ele aja desse jeito. Pensando
00:09:31
assim, a gente vai pra terceira linha
00:09:32
ali que ele vai analisar, ó, se
00:09:35
acontecer de eu ir pro fogo direto, o
00:09:37
fogo é ruim. da próxima vez, evite.
00:09:40
Então, provavelmente ele vai estar ali,
00:09:43
vai ter entendido isso, né? A próxima
00:09:45
vez ele não vai repetir o mesmo o mesmo
00:09:48
erro, porque ele sabe que se ele for
00:09:50
fazer isso, ele do jeito que ele foi
00:09:52
direto, ele pode perder
00:09:54
pontos. Se nós formos olhar na coluna da
00:09:57
direita, a gente vai fazer assim:
00:09:58
primeira coisa, observar. Segunda coisa,
00:10:00
selecionar a opção usando política, né?
00:10:04
Que é, qual é a política que eu vou
00:10:05
usar? Eu vou pro fogo, vou resolver? Não
00:10:07
vou. Terceiro passo, ação. Eu vou para
00:10:09
uma ação específica. Quarto passo, obter
00:10:13
recompensa ou penalidade, que é o que a
00:10:14
gente pode acontecer. Se eu for direto
00:10:16
pro fogo, eu posso receber uma
00:10:20
penalidade. E a política é uma
00:10:22
atualização ou aprendizado.
00:10:24
Obrigatoriamente eu não preciso e eh
00:10:27
acertar, mas eu eu não preciso
00:10:29
obrigatoriamente acertar, mas eu tenho
00:10:31
que aprender. Se eu aprender que ir lá é
00:10:33
ruim, eu não faço de
00:10:35
novo. E por e por último é fazer essa
00:10:38
repetição até conseguir resolver isso.
00:10:40
Daí é uma forma de aprendizado. ele
00:10:42
aprende sendo punido ou sendo sendo
00:10:46
recompensado. Uma outra forma de
00:10:47
aprendizado que nós podemos ver são a
00:10:50
robôs de treinamento. A gente coloca
00:10:51
aqui, apesar de estar em 3D, né, a gente
00:10:54
pessoal usa para fazer a simulação, que
00:10:56
é col coloque algumas regras para
00:10:58
aprender, por exemplo, pro robô pular
00:11:00
alguns degraus. Como é que a gente pode
00:11:02
fazer para que ele aprenda a pular esse
00:11:04
tipo de coisa? A gente coloca algumas
00:11:06
regras, ele pode ir aprendendo, pode
00:11:08
tropeçar muitas vezes ali que a gente
00:11:10
vai ver, ó, tropeçou. Então aquela
00:11:12
aquela tentativa que ele fez não
00:11:14
resolveu. Às vezes segurar a perna mais
00:11:16
para trás resolve. Tudo isso então é
00:11:18
aprendizado por reforço. Vamos ver na
00:11:21
próxima aula onde mais a inteligência
00:11:24
artificial pode estar nas nossas vidas.