00:00:00
jogo a gente passou 2024 inteiro falando
00:00:02
dos mais diversos desdobramentos da
00:00:04
Inteligência Artificial e dessa nova
00:00:06
economia gerada por essa tecnologia mas
00:00:09
a gente falou pouco ou quase nada sobre
00:00:11
um país que é bem relevante no mundo da
00:00:14
tecnologia é a China Por que que isso
00:00:16
aconteceu cara bom a China vamos lá cara
00:00:20
ela tem um plano de ser uma Líder Global
00:00:22
Inteligência Artificial até 2030 ela tem
00:00:24
o plano tem o plano ela tá chegando
00:00:26
próximo disso Bom vamos lá eu acho que
00:00:30
tá caminhando rápido hein Tá caminhando
00:00:32
rápido e no ano passado 2024 ela deu
00:00:36
sinais de
00:00:38
que a coisa tá apertando a a disputa tá
00:00:42
ficando cada vez mais acirrada não é só
00:00:45
as empresas Americanas que tão nadando
00:00:47
de braçada nos no universo da
00:00:50
Inteligência Artificial não ela postou
00:00:51
no Instagram assim se eu virar Líder Não
00:00:54
direi Nada mas Haverá sinais foi isso
00:00:55
que ela fez haver sinais haverá sinais e
00:00:57
tá tá tendo bastante sinal e aí eu vou
00:00:59
trazer dois sinais aqui pra gente
00:01:01
discutir né que são dois principais
00:01:03
modelos hoje chineses que estão
00:01:05
incomodando uhum eh hoje a gente fala de
00:01:08
Inteligência Artificial você já pensa no
00:01:10
quê no chat GPT da openi é ou no gemini
00:01:12
do Google ou o cloue d tropic enfim
00:01:17
empresas Americanas só que desde do ano
00:01:20
passado para cá começaram a surgir
00:01:21
modelos de empresas chinesas que tão
00:01:24
vindo muito bem muito bem e eles têm uma
00:01:27
perspectiva um pouco diferente porque a
00:01:30
maioria desses modelos que estão sendo
00:01:31
criados na China Eles são de código
00:01:33
aberto enquanto que nos Estados Unidos
00:01:35
você tem open Eye que é totalmente
00:01:37
fechado você tem um trop que é
00:01:39
totalmente fechado Você tem o Gemini que
00:01:41
é fechado Mas aí você tem o o Gemma que
00:01:43
é uma versão de código aberto tudo bem
00:01:45
Você tem o Lhama da Meta que que é a
00:01:46
exceção que é de código aberto mas a
00:01:49
China o movimento é muito do código
00:01:50
aberto o que que quer dizer código
00:01:52
aberto código aberto Quer dizer que isso
00:01:54
também tem uma discussão né que se é
00:01:57
realmente de código aberto ou não tal
00:01:59
Porque assim o que eles liberam é o
00:02:00
modelo pré treinado né então o modelo
00:02:02
que foi treinado e você pode utilizar
00:02:04
esse modelo de forma gratuita e você
00:02:07
pode fazer melhorias em cima desse
00:02:09
modelo Então você tem acesso ao ao ao
00:02:11
modelo e você consegue fazer melhorias
00:02:13
consegue customizar tal eh a meta fez
00:02:16
isso então a meta hoje de código aberto
00:02:18
ela ainda lidera o processo mas os
00:02:20
chineses estão vindo muito rápido e aí
00:02:23
você tem um modelo que é o quen quen
00:02:25
quen quen é q w né quen que fo foi
00:02:30
criado pelo grupo da alibabá o alibabá
00:02:32
tem a loja mas ele tem tipo uma uma
00:02:34
vertical de cloud também e foi
00:02:36
desenvolvido pela pela pela alibabá e é
00:02:40
o modelo super assim Super eficiente do
00:02:44
ponto de vista de tamanho e de que ele
00:02:46
consegue fazer ele rivaliza com vários
00:02:48
desses outros modelos americanos com a
00:02:51
vantagem de ser código aberto mas eu
00:02:53
acho que a grande mudança mesmo veio no
00:02:57
finalzinho de Dezembro dia 27 de
00:02:58
Dezembro quando não tem Natal lá então a
00:03:01
galera trabalha né não tem o pessoal
00:03:02
sentando sentando o reio que foi a
00:03:06
Startup de psic que apresentou o modelo
00:03:10
cara que foi tipo tá chamando muita
00:03:11
atenção né Eh muito porque ele já tá em
00:03:15
vários benchmarks porque quando a gente
00:03:17
tá falando de Inteligência Artificial a
00:03:18
gente tá falando como é que a gente
00:03:19
avalia um modelo de a Uhum você tem
00:03:21
conjuntos de tarefas que você coloca o
00:03:24
modelo para executar aquela tarefa e
00:03:25
Verê quanto que ele acerta então tem
00:03:27
tarefa de matemática tarefa de
00:03:28
raciocínio lógico tarefa de resolução de
00:03:29
problema blá E aí o GPT 4 da openi era
00:03:33
um dos que estavam liderando junto com o
00:03:35
cloue e tal e aí veio esse tipc que tá
00:03:37
batendo assim em vários em vários
00:03:40
benchmarks o próprio GPT 4 da da da
00:03:43
openi aí você fala meu que Da onde veio
00:03:46
esse modelo E aí o mais interessante é
00:03:49
entender o processo desenvolvimento
00:03:50
desse modelo uhum porque assim tem uma
00:03:53
disputa né entre Estados Unidos e China
00:03:56
e os Estados Unidos vem fazendo o quê
00:03:58
criando sanções
00:04:00
exato exato o o os Estados Unidos
00:04:04
percebeu que para desenvolver certas
00:04:09
tecnologias Ultra capazes como
00:04:12
Inteligência Artificial e tecnologia
00:04:14
militar você precisa de insumos básicos
00:04:17
e na maior parte das vezes as empresas
00:04:19
que fornecem esses insumos básicos são
00:04:22
norte-americanas de alguma forma os
00:04:24
Estados Unidos tem uma ascensão sobre
00:04:26
elas e pode tomar algumas medidas
00:04:29
durante a pandemia a gente viu uma
00:04:31
escassez enorme de chips mas antes disso
00:04:34
os Estados Unidos já estava fazendo uma
00:04:36
coisa que eu vou comentar agora que é a
00:04:38
proibição de empresas norte-americanas
00:04:42
de fornecer chips Ultra potentes para
00:04:45
companhias chinesas ou pessoas chinesas
00:04:49
e isso quer dizer o quê
00:04:51
NVIDIA vai parar de vender chip que dá
00:04:54
para usar para treinar a inteligência
00:04:57
artificial viu só que não é primeira vez
00:05:00
que os Estados Unidos fez isso em 2015
00:05:03
ele já tinha falado pra Intel Intel você
00:05:07
não vai dar chip para esse super
00:05:09
computador chinês ser eh passar por uma
00:05:13
manutenção e tal e em 2020 os Estados
00:05:16
Unidos proibiu que qualquer empresa que
00:05:19
tivesse tecnologia norte-americana
00:05:21
vendesse para Huawei por que que eu
00:05:22
comentei isso porque o foco tá mudando
00:05:25
primeiro foi para super computador
00:05:27
depois foi para uma empresa gigante
00:05:29
telecomunicação que tinha Ah que naquele
00:05:33
momento tava na crista da onda da do 5g
00:05:36
e agora o foco
00:05:37
voltou a a arma de sanção dos Estados
00:05:40
Unidos foi voltada paraa Inteligência
00:05:42
Artificial e pro desenvolvimento de
00:05:45
tecnologia
00:05:46
militar com isso as empresas
00:05:49
norte-americanas que estão na crista da
00:05:51
onda gostei desse termo viu na crista da
00:05:53
onda do desenvolvimento de GPU para
00:05:55
Inteligência Artificial ficaram
00:05:57
impedidas de fornecer os seus os seus
00:05:59
chips os seus microprocessadores mais
00:06:02
potentes de alguma forma elas já
00:06:04
começaram a se adaptar a esse embargo
00:06:06
mas antes disso aconteceram muitas
00:06:09
histórias curiosas do ponto de vista
00:06:11
humano da tecnologia né Diogo Sim então
00:06:14
assim quando a gente tá falando hoje do
00:06:15
desenvolvimento da de Inteligência
00:06:19
Artificial a gente tem um chip
00:06:21
específico que é o H1 que hoje assim ele
00:06:24
é o mais poderoso da NVidia para o
00:06:26
treinamento de Inteligência Artificial
00:06:28
só só para que você possa ter ideia o
00:06:30
Elon musk nosso amigo aqui que está
00:06:33
sempre presente na nossa mesa aqui do
00:06:35
detil Ele criou o super computador
00:06:37
Colossos né para treinar a inteligência
00:06:39
artificial que hoje ele é considerado o
00:06:41
maior super computador tal Sabe quantas
00:06:44
sabe quantos chips H1 ele tem quanto
00:06:46
Chuta aí uns 10.000 100.000 100.000
00:06:49
100.000 ele comprou todos 100.000 não o
00:06:51
zuberg comprou
00:06:54
350.000 o zuk comprou 350.000 então
00:06:57
assim esse H1 é o que tem hoje deais
00:07:00
poderoso para treinar Inteligência
00:07:01
Artificial e ele é um chip que é
00:07:03
proibido no na China olha só é muito e
00:07:06
aí é muito curioso porque tem várias
00:07:07
histórias super interessantes de como
00:07:09
virou uma indústria
00:07:11
eh esse contrabando de chips H1 pra
00:07:15
China Ah você tá falando daquilo u é
00:07:18
contrabando mesmo então antes a gente
00:07:20
fazia contrabando da China né agora a
00:07:22
gente os chineses estão indo para
00:07:23
Estados Unidos comprando né esses H1
00:07:26
como se fosse uma empresa Americana ou
00:07:29
como se fosse algum residente lá e eles
00:07:31
levam na mala assim né na mala Então tá
00:07:33
tendo uma fiscalização maior tal então
00:07:36
existe o um processo de de de
00:07:40
contrabando mesmo né desses porque
00:07:43
Muamba Muamba porque não pode a China
00:07:46
não pode ter acesso ao HC e o mais
00:07:48
interessante é que essa de psic ela
00:07:51
conseguiu Treinar esse modelo super
00:07:52
poderoso sem ter acesso ao H1 pelo menos
00:07:55
o que eles dizem né então eles treinaram
00:07:56
com uma versão anterior que é a V1 que é
00:07:59
um chipe que é customizado pra China que
00:08:01
é justamente isso que você colocou então
00:08:02
nvd você pode vender Mas se for um pouco
00:08:05
abaixo um pouco abaixo né Um pouquinho
00:08:07
mais lento então eles treinaram com isso
00:08:09
só que de uma maneira muito otimizada
00:08:11
isso que chamou a atenção de toda a
00:08:13
comunidade acadêmica f como é que eles
00:08:14
conseguiram fazer isso porque eles
00:08:16
treinaram um modelo Super Poderoso em
00:08:18
apenas dois meses a um custo de o que
00:08:22
eles colocam né no no no artigo no
00:08:25
technical report né no relatório técnico
00:08:28
de 5 milhões dólares para treinar o
00:08:30
modelo só isso só isso porque quando a
00:08:32
gente pensa e as informações que nós
00:08:34
temos é que o Gemini do Google custou
00:08:36
190 Milhões de Dólares né e e a
00:08:39
capacidade computacional que eles
00:08:40
conseguiram fazer
00:08:42
e necessária para treinar o modelo
00:08:45
também foi super reduzida né quando
00:08:47
comparado com o meta da Lama Dá quase
00:08:49
tipo 20% do Poder computacional isso
00:08:52
mostra também de que essa escassez né de
00:08:54
chips tá levando os chineses a encontrar
00:08:57
soluções mais otimizadas e mais
00:08:58
eficientes entes também dentro do
00:09:00
processo da arquitetura de treinar
00:09:02
Inteligência Artificial O que é muito
00:09:04
louco né porque assim tipo é um é um é
00:09:08
um caminho que não tem muito muito que
00:09:10
ser feito né porque à medida que você
00:09:11
vai criando restrições que é o que os
00:09:13
Estados Unidos vai fazendo de certa
00:09:15
forma você vai incentivando o seu
00:09:17
competidor a achar caminhos alternativos
00:09:19
e depender menos de você então quer
00:09:21
dizer talvez no médio e longo prazo as
00:09:23
sanções tem um efeito reverso né que é
00:09:26
justamente eh incentivar mais uma
00:09:29
indústria local otimizada da China tal e
00:09:31
etc mas a China não ficou quieta né
00:09:33
porque no fim do ano passado ela já
00:09:34
anunciou que vai deixar de exportar
00:09:37
gélio e Germano que são a metais raros
00:09:41
muito importantes pra indústria de
00:09:43
semicondutores mas essa conversa me fez
00:09:47
pensar que a China tem algo parecido com
00:09:49
a gente sabe é um jeitinho chinês de
00:09:51
fazer as coisas eu acho que quem tá
00:09:53
vendo a gente até agora tá se
00:09:55
perguntando pô mas eu tenho que saber
00:09:57
Mandarim para falar com esses llm com
00:10:00
esses modeles chineses ou não não não
00:10:02
precisa isso é interessante também
00:10:04
porque traz um processo de soberania
00:10:06
treinado muito com dados em mandarim
00:10:08
chinês só que ele é multilíngua então
00:10:11
você consegue conversar em português de
00:10:12
boa e assim é muito interessante porque
00:10:14
o que a gente vê de relatos as pessoas
00:10:16
que estão começando a usar o d psic é
00:10:18
que de fato assim eu fiz vários testes
00:10:20
ele é muito mais rápido que o chat GPT
00:10:21
assim sabe o chat GPT ele Você escreve
00:10:23
Ele começa ele é mais lento né Na hora
00:10:26
de dar resposta e o GPS não ele é muito
00:10:28
rápido mesmo assim assim super veloz e
00:10:30
você consegue usar em português também
00:10:32
claro com aquelas limitações que nós
00:10:34
sabemos né o português ele é muito menos
00:10:37
representado no modelo então ele vai
00:10:39
sofrer viés de línguas dominantes no
00:10:41
caso do inglês e agora também do chinês
00:10:43
do mandarim