00:00:03
além da divisão dos algoritmos Com base
00:00:05
no tipo de aprendizado seja
00:00:06
supervisionado ou não supervisionado
00:00:08
podemos dividi-los Com base no tipo de
00:00:10
resposta ou melhor no tipo de problema
00:00:13
que buscam resolver dentre eles Podemos
00:00:15
destacar alguns o primeiro deles é a
00:00:17
classificação na classificação o
00:00:19
objetivo é Identificar qual categoria
00:00:22
determinada informação faz parte em
00:00:24
outras palavras escolher dentre uma
00:00:26
lista pré-definida de diversas
00:00:28
possibilidades se uma imagem diz
00:00:30
respeito à categoria de cachorro ou gato
00:00:32
como no exemplo que já trouxemos
00:00:34
anteriormente o segundo modelo seria a
00:00:36
regressão nesse caso procura-se estimar
00:00:39
um valor numérico e não uma categoria ou
00:00:42
rótulo a regressão pode ser utilizada
00:00:44
para estimar a precificação de um
00:00:46
produto por exemplo o terceiro modelo
00:00:48
seria a claster claster zar nada mais é
00:00:51
do que agrupar o objetivo desse
00:00:54
algoritmo é agrupar dados semelhantes
00:00:56
por exemplo os casos de consumidores que
00:00:59
possuem um o mesmo perfil ou até mesmo
00:01:01
fotos que contém a mesma pessoa nas
00:01:03
redes sociais o último modelo que vamos
00:01:06
tratar aqui é a otimização que faz a
00:01:08
comparação de diversas soluções
00:01:10
possíveis que ocorrem até buscar uma
00:01:12
solução ótima Ou pelo menos satisfatória
00:01:15
que seja encontrada em síntese o
00:01:18
objetivo é buscar a melhor solução
00:01:20
possível como a caso de um jogo no qual
00:01:23
tem diversos inimigos que buscam criar o
00:01:25
melhor caminho até o herói vamos trazer
00:01:27
alguns exemplos para entender esses
00:01:29
modelos na prática a classificação
00:01:32
normalmente tem uma resposta binária sim
00:01:35
ou não faz parte ou não faz parte
00:01:37
pensemos no exemplo de uma compra de
00:01:39
cartão de crédito como o provedor sabe
00:01:41
se é ou não uma compra ou uma fraude
00:01:44
Você já pensou nisso por trás dessa
00:01:46
análise existe uma classificação o
00:01:49
provedor de cartão de crédito Analisa as
00:01:51
suas diversas compras e a partir daí ele
00:01:54
faz uma previsão para saber se é ou não
00:01:57
uma fraude ele está classificando já a
00:02:00
clusterização o sistema busca agrupar os
00:02:03
dados nos diversos padrões aqui temos um
00:02:06
exemplo muito conhecido que é o caso do
00:02:09
Walmart você já deve ter ido ao
00:02:11
supermercado e analisado os padrões
00:02:14
normalmente as sessões são divididas
00:02:16
seja por alimentos seja por churrasco no
00:02:19
qual você vai encontrar bebidas carne e
00:02:22
até mesmo carvão ou seja especificamente
00:02:25
na parte de crianças com fraldas
00:02:28
mamadeiras chupetas você acha que existe
00:02:30
alguma correlação entre fraldas e
00:02:33
cerveja é isso mesmo que o Walmart
00:02:36
conseguiu clusterizar eles perceberam
00:02:38
padrão de consumo de seus clientes
00:02:40
Muitas vezes os pais iam ao supermercado
00:02:43
e comprar fraldas e compravam cerveja
00:02:45
também e a partir daí eles criaram uma
00:02:47
nova sessão agora quando os clientes vão
00:02:50
ao Walmart Eles encontram a cerveja
00:02:53
junto com a fralda por um momento pode
00:02:55
não fazer sentido mas certamente gera
00:02:57
muito mais vendas para o provedor no
00:02:59
final das contas com base em todos esses
00:03:02
modelos disponíveis os cientistas de
00:03:04
dados buscam implementar o melhor
00:03:07
algoritmo cada um com seu objetivo sendo
00:03:10
mais ou menos acurado que tem uma melhor
00:03:13
ou pior resposta que precisa de mais ou
00:03:16
menos processamento ou até mesmo mais ou
00:03:19
menos programação Esses são os famosos
00:03:21
algoritmos que os cientistas de dados
00:03:23
usam para buscar percepções sobre as
00:03:26
informações Além de todos esses
00:03:28
algoritmos que eu apresentei existem
00:03:30
outros no mercado como KNN camins e
00:03:34
modelos de nave base puxa complexos
00:03:37
esses termos vou trazer um exemplo para
00:03:39
tentar facilitar Imagine que você é o
00:03:41
dono de uma barraca de frutas na fira
00:03:43
Você acaba de receber uma fruta nova da
00:03:46
estação que não tem ideia do que se
00:03:48
trata normalmente as frutas têm padrões
00:03:51
seja de Cheiro de gosto de tamanho de
00:03:54
cor de peso então como você vai
00:03:57
classificar essa fruta desconhecida com
00:03:59
base nas suas vizinhas ou melhor com
00:04:01
base nas correlações que você já tem e
00:04:04
já conhece das outras frutas a
00:04:06
classificação de múltiplas classes é o
00:04:09
can nearest neighbor um modelo
00:04:11
disponível no mercado Pense em um
00:04:13
diagrama no qual nós vamos plotar essas
00:04:16
diversas informações disponíveis e
00:04:18
tentar achar exatamente onde essa fruta
00:04:21
desconhecida se encaixa seja no grupo
00:04:24
das maçãs das bananas ou das peras
00:04:27
muitas vezes o computador não sabe
00:04:29
exatamente onde a informação irá se
00:04:31
encaixar porque a sua fruta desconhecida
00:04:33
pode ter o cheiro de uma banana mas o
00:04:35
gosto de uma perira e até mesmo a cor de
00:04:38
uma maçã então ele irá buscar o dado
00:04:41
mais próximo e que faz mais sentido com
00:04:43
base nos clusters disponíveis ainda no
00:04:46
exemplo da barraca de frutas poderíamos
00:04:48
aplicar outro modelo de Inteligência
00:04:50
Artificial que seria a regressão a
00:04:53
regressão Analisa os dados passados para
00:04:55
prever um dado futuro então imagine
00:04:58
aplicar a regressão para prever venda de
00:05:00
frutas com base nos dias da semana
00:05:02
previsão do tempo ou até mesmo local da
00:05:04
feira para resumir acho que vocês
00:05:07
perceberam que existem diversos modelos
00:05:09
e algoritmos no mercado os cientistas de
00:05:11
dados misturam todas essas informações
00:05:14
para criar os melhores modelos possíveis
00:05:16
e tirar resultados para suas
00:05:19
empresas
00:05:23
recapitulando
00:05:25
algoritmos classificação identificar a
00:05:27
qual categoria determinada em formação
00:05:30
faz parte normalmente tem uma resposta
00:05:32
binária sim ou não faz parte ou não faz
00:05:35
parte etc regressão busque estimar um
00:05:39
valor numérico a partir de uma análise
00:05:41
de dados históricos identificando o
00:05:43
padrão de tendência por exemplo elaborar
00:05:45
a precificação de um
00:05:47
produto clusterização o objetivo desse
00:05:51
algoritmo é agrupar dados semelhantes
00:05:53
otimização compara diversas soluções
00:05:56
possíveis até encontrar uma solução
00:05:58
ótima ou
00:06:04
satisfatória