Do ZERO ao GenAI: Databricks como seu atalho para o futuro
Ringkasan
TLDRO webinar 'Do Zero ao Genen' foi realizado para apresentar a jornada de adoção de inteligência artificial e machine learning utilizando a plataforma Databricks. Ana Sanchez e Vitinho conduziram a sessão, que foi gravada para posterior revisão dos participantes. Durante o evento, abordaram-se temas como IA generativa e o papel dos modelos LLM (Large Language Models), destacando aplicações práticas em diversos setores. A Databricks foi introduzida como uma empresa de tecnologia com uma década de atividade, conhecida por criar conceitos como Lakehouse e ter uma receita de mais de 1.5 bilhões de dólares. O webinar também explicou conceitos e técnicas de IA, como machine learning e deep learning, além de discutir ferramentas específicas disponíveis na plataforma Databricks para desenvolvimento de soluções de IA.
Takeaways
- 📅 O evento foi gravado e terá material de revisão.
- 🖥️ Participantes aprenderam sobre IA generativa no Databricks.
- 👥 A equipe de apresentação incluiu Ana Sanchez e Vitinho.
- 📊 Databricks: mais de 10 anos e inovação tecnológica.
- 🧠 Explicação de fundamentos de IA e machine learning.
- 🔍 Exploração de potenciais de IA generativa.
- 🤔 Sessões de perguntas e respostas durante o evento.
- 💡 Introdução ao conceito de Lakehouse da Databricks.
- 🚀 Discussão sobre o uso prático do LLM e seus potenciais.
- 📚 Material educativo e exemplos práticos compartilhados.
Garis waktu
- 00:00:00 - 00:05:00
Início do webinar 'Do Zero ao GNNI', introduzindo a equipe e a importância da interação do público. Explicação sobre a Data Bricks, empresa fundada em 2013, conhecida por criar o conceito de Lake House e outras inovações tecnológicas. Apresentação da agenda que cobre desde fundamentos de IA até um caso de sucesso de IA generativa.
- 00:05:00 - 00:10:00
Ana Sanchez inicia a introdução sobre os fundamentos de inteligência artificial, machine learning e deep learning. Explicações sobre exemplos comuns de IA, como visão computacional e processamento de linguagem natural. A evolução da IA e como machine learning e deep learning contribuem para o desenvolvimento de técnicas mais complexas.
- 00:10:00 - 00:15:00
Discussão sobre IA generativa e os fatores que possibilitam a prática atual da IA, como a existência de grandes datasets e maior poder computacional. O surgimento de inovações em deep learning, como Transformers e Reinforcement Learning, que permitem processamento complexo.
- 00:15:00 - 00:20:00
Detallhamento sobre os modelos LLMs e fundacionais, com foco no processamento de linguagem de grandes conjuntos de dados. Explicação sobre a diferença entre LLMs focados em linguagem de texto e modelos fundacionais que cobrem outras áreas além da linguagem, como o DALL-E para imagens.
- 00:20:00 - 00:25:00
O processo de funcionamento dos LLMs inclui o codificador, modelo Transformer e decodificador. A importância do entendimento dos conceitos de tokenização e embedding para a busca eficiente de informações. Explicações sobre como LLMs são treinados para fornecer respostas mais precisas.
- 00:25:00 - 00:30:00
Introdução ao conceito de 'Prompt Engineering' como o ponto de partida mais simples para trabalhar com LLMs. Importância de definir claramente para o modelo como deve se comportar para fornecer respostas adequadas. Explicações sobre casos de uso de sucesso e a jornada para aplicá-lo dentro das empresas.
- 00:30:00 - 00:35:00
O conceito de 'RAG' (Retrieval-Augmented Generation) como uma solução intermediária que melhora a precisão e atualização das informações fornecidas por LLMs. A integração de uma base de dados para gerar respostas mais contextualizadas e dinâmicas.
- 00:35:00 - 00:40:00
Explicação de como soluções RAG são orquestradas através de bibliotecas de chain, permitindo a recuperação e aumento do prompt com dados relevantes para fornecer respostas mais precisas. Demostrada a prática de identificar e buscar informações não estruturadas através do data warehouse e vector search.
- 00:40:00 - 00:45:00
Como realizar o fine-tuning e eventual pretraining de modelos para adaptá-los a tarefas específicas ou contextos. Comparação entre quando usar RAG versus fine-tuning, com foco na personalização mais avançada e maior controle na resposta dos modelos.
- 00:45:00 - 00:50:00
Casos de uso reais onde o pretraining é aplicado; mencionado exemplo da Bloomberg que treinou modelo especializado no mundo financeiro. Etapas e complexidade do treinamento de um modelo de forma robusta e personalizada para domínio específico.
- 00:50:00 - 00:58:16
Encerramento do webinar com apresentação do caso de sucesso da Arezzo Co que usou AI generativa para melhorar experiência de cliente e eficiência operacional. Anúncio de materials adicionais e incentivos para participantes aplicarem IA nas suas empresas com apoio da Data Bricks.
Peta Pikiran
Pertanyaan yang Sering Diajukan
O que é um webinar?
É um seminário online onde informações são apresentadas ao vivo e interativas para uma audiência via internet.
Quem são os apresentadores do webinar?
Os apresentadores são Ana Sanchez e Vitinho.
Para que serve a plataforma Databricks?
A Databricks serve para ajudar na jornada de uso de inteligência artificial e machine learning em empresas.
Como é classificada a Databricks no mercado?
A Databricks é classificada como uma empresa moderna que tem mais de 10 anos de mercado e é pioneira no conceito de Lakehouse.
Quantos funcionários a Databricks possui?
A Databricks possui mais de 8.000 funcionários em todo o mundo.
Qual é a receita da Databricks?
A receita da Databricks é superior a 1.5 bilhões de dólares.
Qual é o foco principal da inteligência artificial?
O foco principal da inteligência artificial é permitir que computadores imitem o comportamento humano.
Quais são alguns exemplos de uso de IA na vida diária?
Exemplos incluem reconhecimento de fala e linguagem natural, como assistentes virtuais tipo Alexa e Siri.
Quem são os fundadores do conceito Lakehouse?
Os fundadores da Databricks são os inventores do conceito de Lakehouse.
O que são LLMS?
LLMs são modelos de aprendizado de máquina de linguagem que processam tarefas linguísticas.
Lihat lebih banyak ringkasan video
- 00:00:00bom são
- 00:00:0110:3 Então a gente vai iniciar agora o
- 00:00:04webinar do zero ao genen antes da gente
- 00:00:07começar o webinar eu queria salientar
- 00:00:10alguns pontos que são importantes de
- 00:00:12serem compartilhados com todos vocês o
- 00:00:14primeiro deles é que essa sessão ela vai
- 00:00:16ser gravada ela já está sendo gravada
- 00:00:19então posteriormente vocês vão receber
- 00:00:21não só o material que foi apresentado
- 00:00:22mas a gravação para vocês poderem
- 00:00:24revisitar o conteúdo que tá sendo
- 00:00:27compartilhado existe aqui no na no
- 00:00:30botton do zoom aqui no fundo do zoom na
- 00:00:32parte inferior da tela alguns botões que
- 00:00:35vocês conseguem utilizar ao longo desse
- 00:00:37webinar então se vocês tiverem algumas
- 00:00:39perguntas que surgirem no meio da
- 00:00:41apresentação não hesitem em entrar em
- 00:00:43contato conosco através desse botão q en
- 00:00:46que é question and answer pergunta e
- 00:00:47resposta para que vocês possam falar com
- 00:00:49a gente e ao longo da apresentação
- 00:00:51também pra gente poder aqui sentir o
- 00:00:54calor de vocês mesmo a gente estando
- 00:00:55online reajam e interajam principalmente
- 00:00:58aqui comigo que você eu apresent ador
- 00:01:00hoje a Ana Sanchez que também vai estar
- 00:01:02apresentando o webinar comigo e também
- 00:01:04deixem aí o agradecimento para todo o
- 00:01:06pessoal que tá no backend mandem
- 00:01:08coraçãozinho o Lucas rampin o Marcelo
- 00:01:10winer o Caio que vão estar conosco nos
- 00:01:12ajudando a a sair aqui com as respostas
- 00:01:16de todas as perguntas que vocês fizerem
- 00:01:18Bom vamos lá do zero a genen a ideia
- 00:01:20Hoje é a gente conseguir apresentar essa
- 00:01:22jornada para vocês bem como a plataforma
- 00:01:24data Breaks pode abraçar vocês ao longo
- 00:01:27dessa jornada a equipe da data Break que
- 00:01:30tá presente hoje aqui ela é composta
- 00:01:31pela Ana e por mim no qual seremos os
- 00:01:34apresentadores dessa sessão hoje e a
- 00:01:36gente tem um time de peso é bem grande
- 00:01:39aqui para perguntas e respostas que é
- 00:01:40formado pelo Caio pelo Lucas e pelo
- 00:01:43Marcelo então mandem aí bastante
- 00:01:44coraçãozinho para esse pessoal que a
- 00:01:46gente tá com um pessoal bem bom aqui
- 00:01:48dentro da dat Bricks uma galera camisa
- 00:01:5010 que vai ajudar bastante a gente hoje
- 00:01:52ao longo dessa jornada bom para aqueles
- 00:01:55que não conhecem a data Bricks Eu
- 00:01:57imagino que a maioria das pessoas que
- 00:01:58estão aqui hoje já conhecem a data
- 00:01:59Bricks eh mas para aqueles que não
- 00:02:02conhecem é uma oportunidade de conhecer
- 00:02:03ela é uma empresa que foi fundada em
- 00:02:052013 Então temos um pouco mais de 10
- 00:02:07anos de vida hoje somos mais de 8.000
- 00:02:09empregados ao redor do mundo temos uma
- 00:02:12receita superior a 1.5 Bilhões de
- 00:02:14Dólares tivemos já algumas rodadas de
- 00:02:17investimento no passado onde grandes
- 00:02:19empresas fizeram aporte aqui de dinheiro
- 00:02:21né dentro do nosso negócio e somos os
- 00:02:24inventores do conceito Lake House um
- 00:02:26conceito muito difundido no mercado hoje
- 00:02:28utilizado por várias as outras
- 00:02:30companhias que fazem parte desse
- 00:02:32ecossistema de tecnologia também e não
- 00:02:34só isso ah os fundadores da dat Break
- 00:02:36são também os fundadores do Delta Lake
- 00:02:38do mlflow do Spark e de alguns outros
- 00:02:41elementos aí que fazem parte do nosso
- 00:02:43dia a dia no que tange esse processo de
- 00:02:45codificação de workloads de Pipe de
- 00:02:48dados a nossa agenda hoje ela é uma
- 00:02:50agenda bem direta a gente vai como a
- 00:02:52proposta do webinar é ser do zero ao
- 00:02:55genen a gente não pode partir do zero
- 00:02:57sem a gente ter uma base sólida e saber
- 00:02:59sabermos os fundamentos de Inteligência
- 00:03:02Artificial ciência de dados machine
- 00:03:04learning E por aí vai então a gente vai
- 00:03:06passar por todos esses fundamentos até
- 00:03:08chegarmos de fato no que é um l llm
- 00:03:10perdão para que todos nós fiquemos na
- 00:03:12mesma página depois disso a gente vai
- 00:03:15comentar sobre os potenciais da ia
- 00:03:17generativa então o que eu consigo
- 00:03:19alcançar dentro da minha empresa quando
- 00:03:21eu coloco Live um caso de uso de a
- 00:03:24generativa e a partir do momento que a
- 00:03:26gente entendeu o potencial que a gente
- 00:03:28tem com a e generativa Qual é a jornada
- 00:03:31que eu tenho do início ao fim para
- 00:03:33construir casos de uso de sucesso dentro
- 00:03:36da minha empresa com ia generativo Então
- 00:03:38a gente vai passar por toda a jornada de
- 00:03:40A do nível mais simples Até o nível mais
- 00:03:44sofisticado com demonstrações práticas
- 00:03:46para vocês verem como a gente consegue
- 00:03:48fazer isso dentro da plataforma datab
- 00:03:50Breaks e por fim mas não menos
- 00:03:51importante a gente vai trazer um caso de
- 00:03:53sucesso eu não vou falar o nome do
- 00:03:55cliente ainda não vou dar esse spoiler
- 00:03:57mas a gente vai trazer um caso de
- 00:03:58sucesso de um cliente real onde ele
- 00:04:00aplica já no dia a dia dele e a
- 00:04:02generativa com a plataforma dat Breaks
- 00:04:05dito isso a gente vai agora começar com
- 00:04:07a parte de fundamentos e eu passo a
- 00:04:08palavra pra minha colega de time Ana
- 00:04:10Aninha com você Bom dia pessoal Vitinho
- 00:04:14muito obrigada pela super introdução e
- 00:04:16agora vamos começar né Vamos começar a
- 00:04:19falar de fundamentos por pra gente
- 00:04:21realmente sair do zero e colocar todo
- 00:04:23mundo na mesma página como o Vitinho
- 00:04:25falou a gente vai passar para alguns
- 00:04:27fundamentos bem importantes pra gente
- 00:04:29conseguir conseguir trabalhar com ia
- 00:04:30generativa então pra gente começar a
- 00:04:33gente vai introduzir a inteligência
- 00:04:34artificial né E para introduzir a
- 00:04:37inteligência artificial o primeiro ponto
- 00:04:40é justamente explicar o que é né o Tão o
- 00:04:44Tão famoso tal da Inteligência
- 00:04:45Artificial né então basicamente o que
- 00:04:47que ela é né Ela é basicamente qualquer
- 00:04:49técnica que permita aos computadores
- 00:04:52imitar o comportamento humano né então
- 00:04:54como por exemplo né a gente tem a visão
- 00:04:58né então por exemplo lá quando a gente
- 00:05:01quando as pessoas tomam alguma multa por
- 00:05:03exemplo né e tira foto da placa e ele já
- 00:05:06sabe reconhecer Quais que são os
- 00:05:08caracteres ali daquela placa justamente
- 00:05:11é um formato de Inteligência Artificial
- 00:05:13de visão né outro exemplo muito usado
- 00:05:16hoje em dia é caso da fala né então
- 00:05:19várias pessoas né eu sei que tem Alexa
- 00:05:21né Fala com a Siri também então a gente
- 00:05:25falar né com a Alexa e ela nos responder
- 00:05:28é um outro Campo da da Inteligência
- 00:05:31Artificial te fala e a linguagem é um
- 00:05:34campo muito importante também porque
- 00:05:35para ela entender né O que que a gente
- 00:05:38tá falando e conseguir trazer a resposta
- 00:05:40correta é o campo de linguagem né então
- 00:05:43além desses você pode vocês podem
- 00:05:45reparar que o quê esse conceito ele é um
- 00:05:48conceito super antigo né ele surgiu lá
- 00:05:50nos anos 50 mas a gente só vê a
- 00:05:53inteligência artificial em prática
- 00:05:55realmente bem mais paraa frente isso
- 00:05:57porque para Iá tornar uma real idade a
- 00:06:00gente precisa utilizar técnicas que
- 00:06:02consigam gerar esse resultado né como o
- 00:06:05machine learning que a gente tá vendo
- 00:06:07aqui na tela né então machine learning é
- 00:06:10um exemplo de como a gente consegue
- 00:06:11tornar ia uma realidade né justamente
- 00:06:14por ele é um subconjunto de técnicas e
- 00:06:17algoritmos que usam métodos estatísticos
- 00:06:19pra gente permitir com que as máquinas
- 00:06:21aprendam com base nos dados de entrada
- 00:06:24né E quais técnicas que a gente tem de
- 00:06:27exemplo né de machine learning Então a
- 00:06:29gente tem por exemplo a técnica de
- 00:06:30regressão né então quando eu quero
- 00:06:32prever um número né então ah eu vou
- 00:06:34prever o valor das ações amanhã né então
- 00:06:37isso é uma técnica de regressão né
- 00:06:40quando eu quero classificar né algum
- 00:06:43rótulo né então por exemplo Ah eu quero
- 00:06:45saber se esse meil é Spa ou não né a
- 00:06:48gente utiliza as técnicas de
- 00:06:50classificação outra técnica que a gente
- 00:06:52tem aqui de exemplo é claster iação
- 00:06:54quando eu quero agrupar os dados pelas
- 00:06:56suas características semelhantes para
- 00:06:58tirar algum site né Outra técnica muito
- 00:07:02utilizada hoje em dia que surgiu um
- 00:07:04pouquinho mais paraa frente né um pouco
- 00:07:06depois do machine learning é justamente
- 00:07:08o Deep learning né então o Deep learning
- 00:07:12ele já é uma técnica mais avançada que
- 00:07:14machine learning que permite que os
- 00:07:16computadores aprendam e tomam decisões
- 00:07:19no como se fosse nosso cérebro humano né
- 00:07:22E com isso acaba tendo capacidades de
- 00:07:24lidar com dados muito mais complexos do
- 00:07:26que o machine learning né E
- 00:07:28principalmente dados não estruturados
- 00:07:30como imagem audio texto por exemplo né e
- 00:07:33alguns exemplos de Deep learning são
- 00:07:35justamente os casos de nlp né natural
- 00:07:39language processing né então
- 00:07:41processamento de linguagem natural
- 00:07:43justamente para entender por exemplo lá
- 00:07:44num texto Qual é o sentimento que a
- 00:07:47pessoa que escreveu esse texto trazendo
- 00:07:50né negativo positivo é neutro né um
- 00:07:53outro exemplo que usa bastante das
- 00:07:55técnicas Deep learning é a visão
- 00:07:57computacional também né então um outro
- 00:07:59exemplo de visão computacional é quando
- 00:08:01a gente precisa desbloquear o nosso
- 00:08:03celular né e a gente consegue
- 00:08:05desbloquear hoje através do nosso rosto
- 00:08:07isso é uma são utilizadas técnicas de
- 00:08:10Deep learning para conseguir fazer esse
- 00:08:12reconhecimento eh facial tá e a técnica
- 00:08:15queridinha do momento né a técnica que
- 00:08:18vocês vieram aqui para ouvir mais sobre
- 00:08:20é justamente a ia generativa né então
- 00:08:24mais uma década depois agora aqui nos
- 00:08:26anos 2020 né que chegou essa queridinha
- 00:08:29do momento que é justamente a a
- 00:08:31generativa né e o foco dela é criar um
- 00:08:34conteúdo original inovador né e
- 00:08:37conteúdos como textos imagens vídeos e
- 00:08:40códigos né e a par tudo isso a partir de
- 00:08:44padrões apreendidos em grandes conjuntos
- 00:08:47de dados né e alguns exemplos que a
- 00:08:50gente tem aqui são os llms que a gente
- 00:08:52vai se aprofundar um pouco mais paraa
- 00:08:54frente né para trabalhar com dados
- 00:08:56criação de dados mais focados em texto e
- 00:08:59também os difusão models né os modelos
- 00:09:01de difusão para focar mais em dados de
- 00:09:03imagem tá mas assim né Por só agora né a
- 00:09:09gente tá vendo a a i não só a i
- 00:09:13generativa né mas a própria a bombando
- 00:09:16né Então quais foram os fatores que
- 00:09:18fizeram que com que a ia fosse uma
- 00:09:21realidade hoje e não lá nos anos 50
- 00:09:23quando ela foi criada né então o
- 00:09:25primeiro fator é justamente os grandes
- 00:09:28datasets né então o que que acontece a
- 00:09:30gente tem um estudo né que diz o quê que
- 00:09:33não é muitas vezes não é o melhor
- 00:09:35algoritmo que gera o melhor modelo de a
- 00:09:39e sim o o algoritmo que trabalha com a
- 00:09:42maior quantidade de dados né e não só a
- 00:09:45maior quantidade de dados mas com dados
- 00:09:47com qualidade e hoje a gente vê que a
- 00:09:49gente tem diversos datasets muito
- 00:09:52grandes com muita qualidade disponível
- 00:09:54né inclusive no mundo open source a
- 00:09:56gente tem plataformas que consigam lidar
- 00:09:58com essas quantidade de dados né Como o
- 00:10:00próprio dat Bricks Então tudo isso
- 00:10:02possibilita que a gente tenha essa
- 00:10:05tecnologia na prática no nosso dia a dia
- 00:10:08um Outro fator super importante é
- 00:10:10justamente o poder computacional porque
- 00:10:13pra gente conseguir treinar esses
- 00:10:15modelos a gente precisa desse poder
- 00:10:17computacional e antigamente esse poder
- 00:10:19computacional ele era muito caro né
- 00:10:21então acabava tornando inviável essas
- 00:10:23soluções e hoje como a gente tem né um
- 00:10:26poder computacional com valor muito mais
- 00:10:29eh muito mais aquisitivo né muito mais
- 00:10:32eh barato a gente consegue trabalhar com
- 00:10:34esses modelos também né e o último ponto
- 00:10:37né super importante também a gente ter
- 00:10:40justamente esses algoritmos Deep
- 00:10:42learning inovadores né então ter
- 00:10:44tecnologias como as gus os Transformers
- 00:10:47né e o reinforcement learning eh também
- 00:10:50são muito importantes porque eles têm a
- 00:10:52capacidade de processar informações de
- 00:10:54forma muito eficiente né E eles têm uma
- 00:10:58capacidade muito boa de responder como
- 00:11:00os humanos né E além disso com o poder
- 00:11:02de de processamento que a gente tem hoje
- 00:11:05super melhorado né esses modelos são
- 00:11:07capazes de atingir resultados cada vez
- 00:11:10mais significantes tá bom então agora
- 00:11:13vamos mergulhar um pouquinho no mundo do
- 00:11:15llm né que é uma sigla que a gente ouve
- 00:11:18muito no nosso dia a dia e muitas vezes
- 00:11:20a gente não sabe o que significa então
- 00:11:22basicamente né llm ele tá dentro ali do
- 00:11:27conceito justamente de agen
- 00:11:29né então a gente tem tantos os modelos
- 00:11:32de llm e os modelos fundacionais os dois
- 00:11:35eles são treinados com grandes conjuntos
- 00:11:38de dados né grandes mesmos viu gente e
- 00:11:40eles são baseados como a gente comentou
- 00:11:42anteriormente em RS neurais de Deep
- 00:11:44learning né como arquitetura Transformer
- 00:11:46por exemplo E no caso do llm
- 00:11:48especificamente o foco é trabalhar com
- 00:11:51tarefas de processamento de linguagem né
- 00:11:53então basicamente trabalhar com terços
- 00:11:55então aqui embaixo a gente tem alguns
- 00:11:57exemplos já os modelos fundacionais eles
- 00:12:00são modelos que também T outros focos
- 00:12:02além de linguagem né então por exemplo o
- 00:12:05gpt3 que tá nesse exemplo ele é um llm e
- 00:12:09ele também é um modelo fundacional porém
- 00:12:11a gente tem outros modelos fundacionais
- 00:12:13que tem outros focos além da linguagem
- 00:12:16né então a gente pode ver que aqui na
- 00:12:17caixinha Verde a caixinha que tá aqui
- 00:12:20abaixo a gente tem na segunda linha
- 00:12:22outros modelos de exemplo né então a
- 00:12:25gente tem como modelo fundacional o Doli
- 00:12:27né que trabalha para criar novas imagens
- 00:12:30e o Whisper que ele consegue trabalhar
- 00:12:32com áudio né então basicamente Essa é a
- 00:12:34diferença entre os llms e os modelos
- 00:12:37fundacionais tá então quem tinha essa
- 00:12:39dúvida eu espero que agora esteja
- 00:12:41esclarecida tá se não tiver V mandando
- 00:12:43ali no k Enem e Mas como que funciona
- 00:12:46por trás né então qual é o processo pra
- 00:12:50gente conseguir né justamente criar
- 00:12:52esses modelos né então ele trabalha
- 00:12:55basicamente em algumas etapas né Então
- 00:12:58primeiramente ele tem três componentes
- 00:13:00principais né então a gente tem o
- 00:13:02codificador no meio a gente tem o modelo
- 00:13:04Transformer E no fim a gente tem o
- 00:13:06decodificador né então basicamente o
- 00:13:09quantificador ele converte grandes
- 00:13:12entradas né então como pdfs de livros
- 00:13:15htmls por exemplo de da Wikipedia por
- 00:13:17exemplo e entradas de texto em tokens
- 00:13:21que basicamente é o quê é a quebra desse
- 00:13:23texto em partes menores né que ele pode
- 00:13:26ser quebras em palavras e em subpav ras
- 00:13:30ou até mesmo em caracteres tá E aí após
- 00:13:33essa quebra o que que vai acontecer a
- 00:13:35gente vai para essa fase de tokenização
- 00:13:37que a gente vai transformar esses esses
- 00:13:40tokens em valores numéricos depois disso
- 00:13:43Qual é a etapa né dentro de codificação
- 00:13:46é justamente converter esses tokens em
- 00:13:50edgings né e o que que é eding né um
- 00:13:52conceito que a gente fala muito também
- 00:13:53em a generativa é justamente a
- 00:13:56representação matemática dessas inform
- 00:13:59ações em um espaço vetorial e ele serve
- 00:14:02para quê justamente pra gente agrupar
- 00:14:04esses tokens semelhantes né então por
- 00:14:07exemplo se a gente for ver nessa imagem
- 00:14:09que tá aqui dentro de codificação tem um
- 00:14:12exemplo né então a palavra dog e pup
- 00:14:15eles estão muito próximos no espaço
- 00:14:17vetorial Já a palavra vem e Car eles
- 00:14:21estão próximas entre elas mas um
- 00:14:24pouquinho distante ali de dog pup Então
- 00:14:27essa que é a ideia pra gente quebrar
- 00:14:29essas palavras em toking depois em
- 00:14:32badings justamente pra gente aproximar
- 00:14:34elas né Beleza feito isso Qual que é a
- 00:14:37próxima etapa então esses tokens eles
- 00:14:39são usados né dentro de um modelo
- 00:14:42Transformer pré treinado né dependendo
- 00:14:44da arquitetura específica do llm pode
- 00:14:46até haver uma etapa que a gente consegue
- 00:14:49envolver ali um feedback humano paraa
- 00:14:51gente conseguir orientar o modelo na
- 00:14:54geração da saída justamente para tarefas
- 00:14:56mais específicas né então se token
- 00:14:58Passou aqui pro modelo Transformer PR
- 00:15:01treinado E aí depois a gente vai ter um
- 00:15:03resultado né e qual que vai ser o
- 00:15:05resultado então o resultado ele vai ter
- 00:15:07ali um texto de saída né que ele traz
- 00:15:10esse texto de saída né justamente né no
- 00:15:13formato aqui eh numérico e tudo mais
- 00:15:16então a gente tem um decodificador para
- 00:15:18quê paraa gente não trazer pro usuário
- 00:15:20final somente esses números senão ele
- 00:15:21não vai entender nada né então a gente
- 00:15:23usa o decodificador para traduzir de
- 00:15:26volta esses números em texto e uso o
- 00:15:29final ter a resposta ali do seu llm Tá
- 00:15:31bom então basicamente Esse é o processo
- 00:15:34mais utilizado ali mais encontrado nos
- 00:15:36llms
- 00:15:38atuais E agora se vocês estiverem já
- 00:15:41pensando Nossa legal quero usar um llm
- 00:15:43já entendo como funciona por trás mas
- 00:15:46uma das primeiras perguntas que vocês
- 00:15:48podem se fazer é Qual modelo eu devo
- 00:15:50usar né porque existe milhares de
- 00:15:52modelos então a primeira etapa para
- 00:15:54decidir qual modelo usar é entender
- 00:15:56essas duas opções principais né a
- 00:15:59primeira dela é justamente os modelos de
- 00:16:01código aberto e esses modelos eles podem
- 00:16:04ser usados do jeito que eles estão ou ou
- 00:16:07ajustados de acordo com as suas
- 00:16:09necessidades né o Vitinho vai falar um
- 00:16:11pouquinho mais paraa frente como fazer
- 00:16:12um fine tunning como ajustar o modelo
- 00:16:15focado na sua necessidade e esses
- 00:16:17modelos de código aberto permitem isso
- 00:16:19né então eles oferecem justamente essa
- 00:16:21flexibilidade paraa personalização e
- 00:16:24geralmente são de menores tamanhos né
- 00:16:26então isso é bem importante porque ajuda
- 00:16:29muito a reduzir custos né um out e um
- 00:16:31outro tipo de modelo também que tá sendo
- 00:16:33muito utilizado hoje no mercado é
- 00:16:35justamente os modelos proprietários né
- 00:16:38então esses modelos eles são treinados
- 00:16:40também com grandes com conjuntos muito
- 00:16:43grandes de dados né e geralmente eles
- 00:16:45são oferecidos como soluções llm as a
- 00:16:49service né então acredito que vocês
- 00:16:51muitos muita gente já testou né o GPT
- 00:16:54tanto da Open ai quanto do eure openi
- 00:16:56Por Exemplo antropic né também é um
- 00:16:59exemplo de modelo proprietário então
- 00:17:01eles são servidos dessa forma né E só
- 00:17:04que ele tem um ponto que normalmente as
- 00:17:05licenças para esses modelos geralmente
- 00:17:08tem restrição de uso e modificação né
- 00:17:11então é um ponto a se analisar né e cada
- 00:17:14opção tem as suas próprias considerações
- 00:17:16então a escolha de cada um desses
- 00:17:18modelos vai depender de diversos fatores
- 00:17:21né justamente como orçamento requisitos
- 00:17:23de personalizações e também restrições
- 00:17:25de licenciamento né e o que que é legal
- 00:17:28a a gente tem vários modelos hoje né
- 00:17:31então a depender do seu US Case você
- 00:17:34pode usar um modelo diferente você não
- 00:17:36precisa ter um modelo único para usar
- 00:17:37para todos os casos né E essa planilha
- 00:17:40ela é muito legal a gente vai mandar
- 00:17:41depois esse material para vocês porque
- 00:17:43ele tem diversos exemplos né de modelos
- 00:17:47tanto proprietários quanto open source
- 00:17:49né tem algumas explicações ali bem legal
- 00:17:52para até ajudar vocês a definir e tem um
- 00:17:54link mais embaixo com uma lista
- 00:17:56atualizada dos modelos mais recentes que
- 00:17:58a databricks vem trabalhando justamente
- 00:18:01para orientar o cliente né então em cada
- 00:18:03caso de uso Qual o melhor modelo né ou
- 00:18:06os melhores modelos né que eu posso
- 00:18:08testar para eu decidir então a lista é
- 00:18:10bem grande então é bem legal acompanhar
- 00:18:12esse link para vocês estarem sempre
- 00:18:14atualizados nos novos modelos que vão
- 00:18:16surgindo Tá bom então agora gostaria de
- 00:18:19chamar o Vitinho aqui novamente para
- 00:18:21falar Vista tudo isso né Quais são os
- 00:18:24potenciais da ia generativa legal
- 00:18:26obrigado Aninha agora acho que tá tudo
- 00:18:28mundo na mesma página né a gente passou
- 00:18:30pelos fundamentos entendemos O que é o
- 00:18:32llm agora onde a gente consegue chegar
- 00:18:35né Vamos pensar aqui numa casa
- 00:18:37construída as pessoas que hoje TM
- 00:18:39maturidade tão
- 00:18:42produtizar generativa aonde elas estão
- 00:18:45aplicando isso o que que elas estão
- 00:18:47melhorando no dia a dia delas e é um
- 00:18:49pouco dessa percepção que eu gostaria de
- 00:18:51compartilhar com vocês hoje a data
- 00:18:53Bricks ela fez uma pesquisa interna
- 00:18:55dentro dos seus diferentes clientes e
- 00:18:56indústrias no qual temos hoje hoje e a
- 00:18:59gente chegou hoje nesse resultado que
- 00:19:0390% dos casos de uso inicial de llm São
- 00:19:07para eficiência operacional Eu imagino
- 00:19:10que aqui a gente tá com quase 450
- 00:19:12pessoas participando quem aqui hoje usa
- 00:19:15de alguma forma e a generativa para te
- 00:19:17ajudar no dia a dia com tarefas e
- 00:19:19dúvidas que surgem Eu imagino que a
- 00:19:22maioria das pessoas que está aqui
- 00:19:23utilizam dessa forma Ó Chuva de joinha
- 00:19:26Por quê a gente tá tornando o nosso dia
- 00:19:28mais eficiente então no final do dia a
- 00:19:30gente trabalha ali com eficiência
- 00:19:32operacional também e a generativa no
- 00:19:34nosso dia a dia não é muito diferente os
- 00:19:36clientes hoje que já tem casos de uso
- 00:19:38eh de fato Live né produtizar dentro da
- 00:19:42sua empresa inclusive o caso de uso de
- 00:19:44sucesso que a gente vai apresentar lá no
- 00:19:45final é um desses casos que trouxe não
- 00:19:47só eficiência operacional perdão mas
- 00:19:50trouxe também um retorno de investimento
- 00:19:52pra empresa e hoje esses casos de uso
- 00:19:55eles estão separados em vários pilares
- 00:19:57engajamento do cliente busca de
- 00:19:59conhecimento sumarização e geração de
- 00:20:01conteúdo migração de código então a
- 00:20:04gente tem aqui diferentes clientes
- 00:20:05utilizando aí generativa para
- 00:20:07suportá-los em diferentes tópicos também
- 00:20:10às vezes vocês podem se pegar um pouco
- 00:20:12perdido ah Vitor eu trabalho hoje no
- 00:20:14segmento de seguradoras ah eu tô no
- 00:20:17setor público ah eu tô no segmento de
- 00:20:19varejo como que a i generativa pode me
- 00:20:21ajudar pensando nisso a dat Bricks
- 00:20:24construiu um eBook que ela explica
- 00:20:26exatamente com 52 possíveis casos de uso
- 00:20:29para diferentes segmentos da indústria
- 00:20:32então varejo bens de consumo manufatura
- 00:20:35comunicação setor público saúde serviços
- 00:20:38financeiros enfim você vai encontrar ali
- 00:20:40dentro como a ia generativa pode te
- 00:20:42suportar no dia a dia Imagino que os
- 00:20:45casos de uso vão fazer muito sentido
- 00:20:46para vocês e a gente pode pensar aqui em
- 00:20:49produtizar em colocar isso no chão de
- 00:20:50fábrica e fazer acontecer dentro da sua
- 00:20:53empresa e aí vocês devem estar se
- 00:20:55perguntando agora por onde começar a a
- 00:20:58jornada de genen ela tem etapas né e
- 00:21:01vejam que aqui eu tenho quatro grandes
- 00:21:03Pilares eu vou do prompt Engineering até
- 00:21:06o pretraining e essa corzinha aqui não é
- 00:21:08para deixar o slide bonito é Porque de
- 00:21:11fato a gente tem aqui uma sofisticação e
- 00:21:14um nível de complexidade que vai ser
- 00:21:16adicionado à medida que a gente for
- 00:21:19caminhando para esse lado direito então
- 00:21:21hoje quando eu falo assim ah por onde eu
- 00:21:23começo a nossa sugestão É vamos começar
- 00:21:26pelo prompt Engineering por quê é o é a
- 00:21:29maneira mais simples da gente embarcar e
- 00:21:32iniciar uma jornada com a a ia
- 00:21:34generativa à medida que a gente ganhar
- 00:21:36maturidade eu ganhar maturidade nos
- 00:21:38fundamentos nos conceitos a gente vai
- 00:21:40subindo um degrau dessa escada Então a
- 00:21:43gente vai passar pelo reg pelo fine
- 00:21:44tuning finalmente chegar no PR trining
- 00:21:46caso seja necessário mas para isso é
- 00:21:49muito importante a gente entender o que
- 00:21:50é o prompt Engineering Então qual que é
- 00:21:53a definição de prompt Engineering é a
- 00:21:55criação de prompts especializados para
- 00:21:58guiar as respostas do llm llm agora todo
- 00:22:01mundo já sabe o que significa então eu
- 00:22:02não preciso me preocupar veja que para
- 00:22:05fazer um prompt Engineering eu não
- 00:22:07preciso disponibilizar dados para ia
- 00:22:10generativa ou seja eu não preciso pegar
- 00:22:12um histórico de dados meu uma tabela de
- 00:22:14dados minha para fazer com que o prompt
- 00:22:16Engineering seja capaz de responder a
- 00:22:19pergunta que eu tô fazendo vantagem aqui
- 00:22:21é uma customização extremamente rápida
- 00:22:24então aqui eu tenho um exemplo para
- 00:22:25vocês de prompt Engineering imagina que
- 00:22:27eu queira ionar ali as respostas das
- 00:22:30perguntas que vão ser feitas em cima de
- 00:22:32um assistente então eu vou ali e faço
- 00:22:34uma pergunta do tipo como eu faço para
- 00:22:36desligar um cluster veja que eu tô
- 00:22:38utilizando aqui no meu backend um modelo
- 00:22:40fundacional que foi treinado com milhões
- 00:22:42e milhões talvez bilhões de parâmetros
- 00:22:45de dados provenientes da internet gente
- 00:22:48cluster pode ser uma palavra que
- 00:22:50endereça várias situações e esse é o
- 00:22:53caso eu gostaria que ele tivesse me
- 00:22:54respondido olhando pro mundo dat Bricks
- 00:22:57mas não ele me responde de maneira
- 00:22:59genérica pensando que eu tô falando de
- 00:23:01um cluster ali talvez dentro de um cnet
- 00:23:03e não é o caso então o que que acontece
- 00:23:05você
- 00:23:06precisa dizer pro seu llm como ele deve
- 00:23:10se comportar e aí a gente consegue
- 00:23:11colocar um um prompt de sistema por
- 00:23:14exemplo eu consigo ir ali e declarar
- 00:23:16você é um assistente do databricks que
- 00:23:19está ajudando usuários a utilizar os
- 00:23:20recursos do databricks Responda de
- 00:23:23maneira objetiva cordial e sempre em
- 00:23:25português veja que se eu replicar a
- 00:23:28pergunta nesse momento como faço para
- 00:23:30desligar um cluster ele vai levar em
- 00:23:32consideração que ele é um assistente do
- 00:23:34dat Bricks e ele vai me trazer a
- 00:23:35resposta certa de como eu devo seguir
- 00:23:38ali no final do dia para ter sucesso
- 00:23:40nessa minha tarefa por trás existe um
- 00:23:44conceito muito interessante que faz tudo
- 00:23:46isso acontecer que é o conceito de eu
- 00:23:48servir o meu modelo para eu conseguir
- 00:23:50criar uma aplicação como essa que vocês
- 00:23:52estão vendo aqui hoje eu preciso ter um
- 00:23:54modelo fundacional a Aninha já explicou
- 00:23:56né Open sece ou proprietário mas eu
- 00:23:59preciso ter um lugar de onde eu possa
- 00:24:01plugar naquele modelo para consumir ele
- 00:24:04e hoje dentro da dat Bricks como a gente
- 00:24:06suporta os nossos clientes com essa
- 00:24:07jornada através do que a gente chama
- 00:24:10hoje de Model serving Model serving o
- 00:24:12nome é muito intuitivo né servir modelos
- 00:24:15e ali dentro eu posso servir modelos
- 00:24:16tradicionais tem gente que não gosta
- 00:24:18dessa nomenclatura Me desculpa se você
- 00:24:20não gosta mas quando eu falo
- 00:24:21tradicionais os modelos ali de ch os
- 00:24:24modelos de regressão enfim os modelos
- 00:24:25que a gente tá acostumado a falar já tem
- 00:24:27bons anos mas a gente consegue também
- 00:24:29hoje servir modelos fundacionais modelos
- 00:24:32externos que são os modelos
- 00:24:33proprietários como Aninha trouxe aqui né
- 00:24:35antropic Ager Open ey Open ey enfim e
- 00:24:38entre outros então a gente tem essa
- 00:24:40capacidade hoje que abraça o dat Breaks
- 00:24:43Além disso eu imagino que aqui nessas
- 00:24:45450 pessoas que a gente tem hoje dentro
- 00:24:47da sessão Existem várias que já T uma
- 00:24:49subscrição ativa com algum tipo de
- 00:24:51modelo proprietário se você tem um
- 00:24:53modelo proprietário você poderia
- 00:24:55servi-lo utilizando dat Breaks também a
- 00:24:58através do que a gente chama de ai
- 00:24:59Gateway Qual que é o grande benefício do
- 00:25:01ai Gateway é você controlar é como se
- 00:25:04fosse um portão literalmente e você
- 00:25:07controla tudo que tá acontecendo com
- 00:25:09aquela api do seu modelo então permissão
- 00:25:12e limitação de taxa para controlar quem
- 00:25:14tem acesso e quanto de acesso aquela
- 00:25:16pessoa deveria ter registro de payload
- 00:25:18rastreamento de uso caso eu precise
- 00:25:21depois auditar né quais dados estão
- 00:25:24sendo enviados paraas apis de modelo e
- 00:25:26quem tá fazendo esse request nessa api
- 00:25:29eu posso definir aqui também ai guard
- 00:25:31rails né ou seja Vitor tenho uma
- 00:25:33preocupação muito grande de Security no
- 00:25:34meu time com vazamento de dados como eu
- 00:25:36trabalho isso a gente consegue limitar
- 00:25:38aqui essa questão do ai guard rails
- 00:25:41também na prática pra gente ver vamos
- 00:25:43passar agora por essa questão do Model
- 00:25:45serving do ai Gateway para vocês
- 00:25:47conseguirem Navegar junto comigo na
- 00:25:48plataforma datab Breaks e conhecerem
- 00:25:50mais profundamente o que a gente tem lá
- 00:25:52dentro da plataforma datab Bricks no
- 00:25:54canto esquerdo você tem vários tópicos e
- 00:25:56ali dentro lá embaixo dentro do tópico
- 00:25:58de machine learning você tem a parte de
- 00:26:00serving nessa parte de serving você vai
- 00:26:02encontrar um monte de modelo Open sece
- 00:26:04através de paper token Onde você
- 00:26:06consegue utilizar ou você pode servir o
- 00:26:08seu próprio modelo se você escolher a
- 00:26:10opção de servir o próprio modelo você
- 00:26:12pode criar o seu próprio endp seja para
- 00:26:14servir um modelo open source seja para
- 00:26:17servir um modelo externo aqui utilizando
- 00:26:19a ideia do a Gateway que a gente
- 00:26:21comentou um ponto muito interessante
- 00:26:23também é que você pode usar o unit
- 00:26:25catler com modelo registrado ali dentro
- 00:26:27ou seja você você garante toda a
- 00:26:29governabilidade em cima dos ativos que
- 00:26:32tangem o assunto de modelagem indo pra
- 00:26:34prática eu vou pegar um modelo da Open
- 00:26:36ey agora e eu vou mostrar para vocês o
- 00:26:38que a gente tem ali dentro quando eu tô
- 00:26:39trabalhando com modelo externo veja que
- 00:26:41eu consigo trabalhar com permissões eu
- 00:26:43consigo definir quem pode usar esse
- 00:26:45endpoint quem pode só visualizar quem
- 00:26:48pode gerenciar esse endpoint então eu
- 00:26:50consigo configurar essas permissões E
- 00:26:53além disso eu tenho a possibilidade aqui
- 00:26:55também do ai Gateway Onde eu consigo
- 00:26:57configurar todo todos os pontos que Eu
- 00:26:58mencionei para vocês o o o rastreamento
- 00:27:01de uso tabelas de inferência o guard
- 00:27:03reio ji para segurança enfim eu consigo
- 00:27:05definir tudo isso ali dentro também a
- 00:27:08partir do momento que você seleciona
- 00:27:10qual é o modelo que você quer utilizar
- 00:27:12ou quer testar um ótimo lugar para você
- 00:27:14testar o prompt Engineering é dentro do
- 00:27:16playground Então vem Navegar comigo
- 00:27:18dentro do playground lá dentro a gente
- 00:27:20pode selecionar diferentes modelos de
- 00:27:22novo sejam modelos open source sejam
- 00:27:25modelos proprietários você escolhe qual
- 00:27:27é o modelo que você quer trabalhar e o
- 00:27:29que é legal aqui você consegue testar os
- 00:27:32três modelos ao mesmo tempo então
- 00:27:33imagina que eu sou um assistente de
- 00:27:35contratos do imposto de renda e eu
- 00:27:37coloco ali posso declarar minha sogra
- 00:27:39como dependente eu tô vendo aqui que
- 00:27:41deve ter uma galera que não quer
- 00:27:42declarar a sogra de jeito nenhum né
- 00:27:44vamos ver se a gente pode declarar ou
- 00:27:45não a sogra e aí a gente vê aqui que o
- 00:27:48liama ele traz algumas informações que
- 00:27:51parecem ser pertinentes o dbx me
- 00:27:54responde em inglês e passa longe e o
- 00:27:56open Eye ali ele dá ali um ol eu não
- 00:27:58posso muito fornecer informações mas
- 00:28:00ainda me dá um texto veja que aqui eu
- 00:28:02consigo já avaliar como um modelo
- 00:28:05fundacional tá se comportando diante da
- 00:28:08pergunta que eu fiz agora imagina um
- 00:28:10cenário diferente aqui eu não tenho
- 00:28:11nenhum prompt de sistema mas eu quero eu
- 00:28:13quero definir um prompt de sistema
- 00:28:15dentro dessa situação então eu vou lá e
- 00:28:18crio esse prompt de sistema falando o
- 00:28:20seguinte Olha você vai ser um assistente
- 00:28:23da Receita Federal do Brasil e responda
- 00:28:25sempre as perguntas em português eu vou
- 00:28:27lá e replico com a minha pergunta posso
- 00:28:29declarar a minha sogra como dependente
- 00:28:31para ver agora se os modelos vão
- 00:28:32performar de forma equalitário ou se vai
- 00:28:34alterar muito o que eu já tinha aqui
- 00:28:36dentro veja que o dbx ele agora consegue
- 00:28:39me trazer uma resposta talvez não tão
- 00:28:40aderente quanto eu gostaria mas ele
- 00:28:42consegue ali me trazer um pouco de
- 00:28:44contexto isso é prompt Engineering veja
- 00:28:47que não tem muita dificuldade aqui a
- 00:28:48gente ainda foi numa numa fase bem
- 00:28:51simples né da jornada de prompt
- 00:28:52Engineering mas aqui já é o primeiro
- 00:28:54passo para vocês começarem a utilizar eh
- 00:28:57e a generativa na prática óbvio que
- 00:28:59existem steps e o próximo step agora
- 00:29:02depois que prompt Engineering não te
- 00:29:03atende mais é você trabalhar com o
- 00:29:05conceito de reg e para falar de reg a
- 00:29:07Aninha vai apresentar pra gente Esse
- 00:29:10conceito Obrigada Vitinho muito
- 00:29:13interessante a gente ver o quanto é
- 00:29:14simples né trabalhar com llm né com o
- 00:29:17próprio prompt Engineering só que em
- 00:29:19muitos casos a gente não tem informação
- 00:29:21mais atualizada né então como vocês
- 00:29:23viram a gente em cada um dos modelos o
- 00:29:26primeiro modelo ele foi o mais mais
- 00:29:28próximo de trazer a resposta correta
- 00:29:30porém ele trouxe uma resposta
- 00:29:32desatualizada né então ele trouxe uma
- 00:29:34resposta do ano anterior do Imposto de
- 00:29:36Renda né falando que o teto ali do o
- 00:29:40teto dos recursos da sogra teria que ser
- 00:29:4225.000 e na verdade não é esse valor né
- 00:29:45então como a gente poderia solucionar
- 00:29:47esse problema né pensando na nossa
- 00:29:48empresa muitas vezes a gente vai
- 00:29:50precisar ter ali um chat para fazer
- 00:29:52perguntas sobre documentos vivos né que
- 00:29:55chegam não uma vez por ano como na
- 00:29:57Receita Federal né nesse caso do Imposto
- 00:29:59de Renda mas sim documentos diários
- 00:30:01documentos semanais se a gente
- 00:30:04precisasse retreinar esse modelo do zero
- 00:30:06toda semana todos os dias daria um
- 00:30:08trabalhão né então por isso que a gente
- 00:30:10tem a solução de reg justamente para
- 00:30:14simplificar esse processo e a gente ter
- 00:30:16os nossos chats com respostas muito mais
- 00:30:18acuradas né E como que funciona então
- 00:30:21esse tal de reg né então a sigl
- 00:30:24significa retriever retrieval sorry
- 00:30:27aument Generation e qual é a definição
- 00:30:30então basicamente é a gente combinar o
- 00:30:32nosso llm com um prompt e principalmente
- 00:30:37com uma base de dados que é onde vai ter
- 00:30:39essas informações mais atualizadas né
- 00:30:41então o requerimento de dados é
- 00:30:43justamente a gente ter essa base pra
- 00:30:45gente acoplar aí nessa solução né o
- 00:30:48tempo de treino ele é moderado porque a
- 00:30:50única coisa que a gente vai precisar
- 00:30:51fazer na questão mais de treinamento é a
- 00:30:54gente converter os os nossos textos os
- 00:30:57nossos documentos
- 00:30:58beding né que eu expliquei para vocês
- 00:31:00anteriormente para ele localizar
- 00:31:02justamente o conteúdo correto do
- 00:31:04documento as vantagens é justamente que
- 00:31:06a gente vai ter esse contexto super
- 00:31:08atualizado e dinâmico né e as
- 00:31:10considerações a gente acaba aumentando o
- 00:31:13prompt Porque além do prompt a gente
- 00:31:15adiciona as informações encontradas no
- 00:31:17documento e aí tem um pouquinho mais de
- 00:31:19computação necessária porém a gente tem
- 00:31:22um resultado muito mais acurado e muito
- 00:31:24mais atualizado Tá então vamos ver como
- 00:31:28funciona o processo fim a fim para
- 00:31:30trabalhar no cenários de reg então
- 00:31:33voltando a pensar nesse nosso caso de
- 00:31:35uso né no assistente de Imposto de Renda
- 00:31:37vamos ver como seria esse processo por
- 00:31:39debaixo dos panos trabalhando com reg né
- 00:31:42O que que mudaria ali do processo de
- 00:31:44somente prompt Engineering Então a
- 00:31:46primeira etapa né a gente vai ter
- 00:31:49justamente o o usuário mandando a
- 00:31:52pergunta se ele pode declarar a sogra
- 00:31:54como dependente e a partir daí a
- 00:31:57primeira fase vai ser justamente enviar
- 00:32:00essa pergunta que o usuário fez para um
- 00:32:03embed llm Para quê Para ele justamente
- 00:32:07transformar essa pergunta em um vetor de
- 00:32:09números aí na segunda etapa o que que a
- 00:32:12gente vai fazer nessa segunda etapa ele
- 00:32:16vai buscar né no na nossa base vetorial
- 00:32:21Qual é a parte do texto né Qual é aonde
- 00:32:24tá nesse documento a resposta mais
- 00:32:28próxima dessa pergunta que o usuário fez
- 00:32:31né por isso que a gente transforma ali
- 00:32:32em vetorial depois disso qual que vai
- 00:32:35ser a etapa a gente vai ter o Retorno
- 00:32:38dos desse conteúdo que ele vai ser
- 00:32:41acoplado ao nosso prompt né então o
- 00:32:43nosso prompt basicamente é responda a p
- 00:32:47que é a pergunta do usuário baseado em C
- 00:32:51né então c é o conteúdo relevante que a
- 00:32:53gente trouxe dessa base de dados e aí a
- 00:32:56gente vai empacotar tá todo esse esse
- 00:32:59texto e vai mandar ali pro nosso llm que
- 00:33:02pode ser qualquer um daqueles modelos
- 00:33:03que a gente apresentou lá no início e aí
- 00:33:06ele vai trazer a resposta pro usuário né
- 00:33:09então ele vai explicar Quais são as
- 00:33:11regras para declarar a sogra como
- 00:33:14dependente tá E aí vocês podem ver né a
- 00:33:16sigla retrieval retrieval aent
- 00:33:19Generation é justamente isso retrieval é
- 00:33:22justamente essa essa parte de buscar o
- 00:33:25dado na minha base de dados aument é
- 00:33:29justamente pra gente aumentar ali o
- 00:33:31nosso prompt com esses dados né a gente
- 00:33:34adicionar mais informações nesse prompt
- 00:33:36e o Generation é gerar o resultado final
- 00:33:39pro usuário tá então agora o que que a
- 00:33:42gente vai fazer vamos ver na prática
- 00:33:44como que a dat Bricks te ajuda nesse
- 00:33:46processo todo né como a dat Bricks
- 00:33:48simplifica que a gente consiga criar é
- 00:33:51soluções reg mas para isso antes disso a
- 00:33:54gente tem que pensar num passo muito
- 00:33:55importante que justamente é etapa de
- 00:33:58qual tipo de base de dados que eu vou
- 00:34:01utilizar pra minha solução né então a
- 00:34:03gente tem dois tipos de base de dados
- 00:34:05que a gente pode usar nesse cenário a
- 00:34:07primeira quando a gente tá trabalhando
- 00:34:09justamente nesse caso de uso que são
- 00:34:11documentos né então grandes textos ali
- 00:34:14de documentos que a gente precisa
- 00:34:16encontrar através de similaridade o
- 00:34:19Vector search é uma solução que
- 00:34:21simplifica muito esse processo né e o
- 00:34:24Vector se da det Bricks ele é muito
- 00:34:26legal por quê Porque basicamente a gente
- 00:34:28consegue sincronizar qualquer tabela
- 00:34:30Delta com esse Vector search e não
- 00:34:33precisa criar um pipeline de dados extra
- 00:34:36para fazer sincronização não é um uma
- 00:34:38forma muito visual de fazer e muito
- 00:34:40simplificada que vocês vão ver daqui a
- 00:34:42pouco na demo né mas agora se por
- 00:34:44exemplo né eu tenho dados ali
- 00:34:46estruturados né Eu tenho um ID do meu
- 00:34:49cliente né que tá logado ali nesse meu
- 00:34:51chatbot e eu preciso encontrar além de
- 00:34:54informações ali de documentos né tirar
- 00:34:57dúvida ali sobre imposto de renda eu o
- 00:34:59cliente quer saber também quanto foi o
- 00:35:02valor restituído na sua última
- 00:35:04declaração nesse caso a gente poderia
- 00:35:07utilizar uma outra base adicional né que
- 00:35:10chama feature serving ou online tables
- 00:35:13né que ele é justamente para quê com
- 00:35:15base nesse ID do meu cliente eu vou
- 00:35:18encontrar essa informação nessa tabela E
- 00:35:20aí eu vou trazer esse valor desse esse
- 00:35:22valor restituído do cliente no chatbot
- 00:35:25né então ele é bem legal porque na
- 00:35:26solução r eu posso trabalhar tanto com
- 00:35:28os dados não estruturados de documento
- 00:35:30usando Vector search quanto valores
- 00:35:32estruturados com feature server ou com
- 00:35:34os dois na mesmo bot tá então é bem
- 00:35:37legal e a gente vai mandar depois o link
- 00:35:39para vocês de um exemplo com esses dados
- 00:35:41estruturados porque na demo hoje tá mais
- 00:35:43focada com os dados de documentos tá
- 00:35:46então pra próxima etapa né qual que vai
- 00:35:49ser então depois que a gente decidiu né
- 00:35:50então no nosso caso de uso a gente tá
- 00:35:53trabalhando aqui com documentos a gente
- 00:35:55vai usar o Vector search como a gente
- 00:35:58faz para orquestrar né então a gente viu
- 00:36:00lá que a gente tem o nosso orquestrador
- 00:36:02né então o nosso orquestrador que a
- 00:36:04gente pode utilizar aqui no data Bricks
- 00:36:06né e até em outras plataformas é
- 00:36:08justamente as cadeias né que a gente
- 00:36:10chama de chin né que ela basicamente faz
- 00:36:12o quê né então elas são bibliotecas que
- 00:36:16fazem justamente essa etapa né então a
- 00:36:18gente aponta Qual é a base que a gente
- 00:36:21vai buscar essa informação depois a
- 00:36:23gente coloca o nosso prompt e aponta
- 00:36:26Qual que é o nosso l m para trazer o
- 00:36:28resultado né então basicamente a gente
- 00:36:31segue essas etapas depois a gente vai
- 00:36:33Compartilhar esse material para vocês
- 00:36:34verem alguns exemplos de código e por
- 00:36:36fim a gente precisa registrar esse
- 00:36:39modelo né justamente pra gente garantir
- 00:36:41a governança a a linhagem entender todo
- 00:36:45esse processo né do nosso do nossos
- 00:36:48modelos a gente consegue integrar com o
- 00:36:50Emil Flow simplesmente com alguns
- 00:36:52comandos como mostra aqui na tela né
- 00:36:54então a gente tem toda a integração a
- 00:36:56diversos tipos de cadeia né como leng
- 00:36:58Chin que é o mais utilizado hoje
- 00:37:00diretamente com a mflow tá então ele é
- 00:37:03super legal então agora a gente vai pra
- 00:37:05demo e é um ponto importante por conta
- 00:37:07do tempo a gente não vai conseguir
- 00:37:08mostrar todo o código por trás né mas
- 00:37:11quem tiver curiosidade pessoal fique
- 00:37:13super a vontade em procurar o time de
- 00:37:15conta de vocês para disponibilizar esse
- 00:37:17código e para quem não souber quem é o
- 00:37:20seu time de conta fiquem à vontade para
- 00:37:22nos procurar que a gente ajuda vocês a
- 00:37:24descobrir e a Compartilhar esse material
- 00:37:26então vamos lá então Então vamos agora
- 00:37:28pra prática Então a primeira coisa que a
- 00:37:30gente fez foi justamente pegar o
- 00:37:32material PDF mais atualizado da Receita
- 00:37:34Federal sobre o Imposto de Renda dali
- 00:37:37que a gente já pesquisou as informações
- 00:37:39sobre a sogra e viu que o modelo que a
- 00:37:42gente foi testar anteriormente no prompt
- 00:37:44Engineering não tinha trago a informação
- 00:37:46correta Né tava trazendo ali que a
- 00:37:48isenção era no anual no máximo de 25.000
- 00:37:52e pouco e na verdade diminuiu né 24.500
- 00:37:57a pessoa usasse ali aquele bote e
- 00:38:00colocasse ali a informação eh uma esse
- 00:38:03valor ele ia ter alguns problemas com a
- 00:38:05Receita Federal né então visto isso a
- 00:38:09gente baixou né esse documento PDF então
- 00:38:12a gente acessou o nosso catálogo dali a
- 00:38:14gente procurou o nosso esquema da nossa
- 00:38:16demonstração e dali a gente foi em
- 00:38:18volumes né então como é um dado não
- 00:38:21estruturado a gente acaba colocando essa
- 00:38:23informação em volumes então a gente
- 00:38:25criou uma pastinha eo subiu esse PDF lá
- 00:38:29em volumes depois disso qual que foi a
- 00:38:31próxima parte né então basicamente é a
- 00:38:34gente pegar esse documento quebrar ele
- 00:38:37no que a gente chama de chunks né então
- 00:38:39são pedacinhos menores de textos para
- 00:38:42quê para ficar mais fácil do Vector
- 00:38:45search encontrar informação então foi
- 00:38:47isso que a gente fez por trás Então
- 00:38:49feito isso que que a gente vai fazer
- 00:38:51agora então agora a gente vai acessar
- 00:38:54essa tabela que a gente quebrou esses
- 00:38:56dados do PDF né então é uma tabela Delta
- 00:38:59comum e aí a gente criou Super simples
- 00:39:02dois Campos um campo de ID e um campo
- 00:39:05que tem a pergunta e a resposta agrupada
- 00:39:08ali nessa linha né Então feito isso a
- 00:39:12gente colocou todas as perguntas e
- 00:39:14respostas do documento nessa tabela
- 00:39:16Delta e a partir daí a gente já consegue
- 00:39:19criar um Vector search com alguns
- 00:39:21cliques né a gente também consegue fazer
- 00:39:23por código né mas para quem prefere de
- 00:39:26forma visual a a gente vem ali em Create
- 00:39:28Vector search Vector search index coloca
- 00:39:31o nome desse Vector search então
- 00:39:33coloquei esse nome aqui depois
- 00:39:35selecionei a minha chave primária depois
- 00:39:38eu vou selecionar um end Point de Vector
- 00:39:40search previamente criado também a gente
- 00:39:43consegue criar com alguns cliques as
- 00:39:45colunas que a gente vai sincronizar né
- 00:39:48automaticamente da tabela Delta para as
- 00:39:50tabela de Vector search né Depois de se
- 00:39:53a gente colocar em branco ele vai pegar
- 00:39:55todas depois disso eu vou selecionar
- 00:39:58Qual é o llm de embedding que eu vou
- 00:40:00utilizar né para converter essas
- 00:40:03perguntas em respostas em edgings néz
- 00:40:07fiz isso cliquei em Sink aqui para
- 00:40:09salvar em uma outra tabela Delta mas
- 00:40:11para ter rastreabilidade e por fim eu
- 00:40:14posso selecionar triggered para rodar
- 00:40:16isso uma vez por dia uma vez por semana
- 00:40:19ou se é uma informação viva né que vem o
- 00:40:22tempo todo eu posso clicar continu que
- 00:40:25ela já vai ser uma uma operação em
- 00:40:28streaming né então toda vez que chegar
- 00:40:30um novo documento né na e a gente tiver
- 00:40:33isso na tabela Delta automaticamente ele
- 00:40:35vai ser sincronizado com o nosso endp
- 00:40:38agora a gente pode fazer um teste né
- 00:40:41então depois que eu criei o meu Vector
- 00:40:42search eu posso já testar então eu posso
- 00:40:44mandar posso declarar minha sogra como
- 00:40:46dependente E aí ele vai trazer
- 00:40:49Justamente a parte do documento que tem
- 00:40:51essa resposta então show de bola nosso
- 00:40:53Vector search Tá funcionando então agora
- 00:40:56a gente pode criar a nossa cadeia
- 00:41:02rec mas para isso para facilitar também
- 00:41:06todo esse processo como essa parte a
- 00:41:07gente tem que né acabar programando o
- 00:41:09nosso agente O que que a gente precisa o
- 00:41:11que a gente pode fazer né o dat Bricks
- 00:41:13Ele criou o mosaic a ag gente Framework
- 00:41:16que ele é um Framework que simplifica
- 00:41:18muito essas etapas né e além de
- 00:41:20simplificar ele traz funcionalidades que
- 00:41:23ajudam muito nesse processo né então ele
- 00:41:26ajuda muito toda a parte de integração
- 00:41:28com m Flow que eu falei com vocês
- 00:41:30anteriormente toda a parte de
- 00:41:32monitoração a parte de avaliação que é
- 00:41:34um ponto muito importante né quando a
- 00:41:36gente cria esse produto a gente tem que
- 00:41:38deixar os nossos stakeholders o nosso
- 00:41:40cliente final testar né então antes de
- 00:41:44colocar isso em produção então também a
- 00:41:46gente consegue criar um app super visual
- 00:41:48pros usuários testarem e inclusive fazer
- 00:41:51avaliações através de outras llms
- 00:41:54automatizadas pra gente ver se ela tá
- 00:41:56respondo Endo corretamente ou não então
- 00:41:58são recursos muito
- 00:42:00legais e agora a gente vai ver né como
- 00:42:04que vai ficar o resultado então agora a
- 00:42:06gente usou o mosaic Agent ai Framework
- 00:42:10né para criar essa cadeia né que nem eu
- 00:42:12comentei o código depois a gente
- 00:42:13compartilha com vocês e gerou esse
- 00:42:15agente então agora o que que a gente vai
- 00:42:17fazer a gente vai voltar lá naquela demo
- 00:42:19do Vitinho né que ele fez somente ali
- 00:42:21com os llms e o prompt Engineering aí a
- 00:42:24gente vai comparar com o nosso Agent
- 00:42:27criado aqui de com a solução reg então
- 00:42:30Vitinho vamos
- 00:42:31lá legal então aqui na nossa
- 00:42:34demonstração Então a gente tem o Lhama
- 00:42:36novamente o d brx e o nosso agente então
- 00:42:39eu pergunto novamente se eu posso
- 00:42:40declarar minha sogra como dependente e a
- 00:42:43gente vê agora o lama mandou outro valor
- 00:42:46um valor de 28.000 e a gente vê que o
- 00:42:49único correto com a informação
- 00:42:50atualizada é justamente o nosso agente
- 00:42:54que a gente criou utilizando ali o
- 00:42:56Vector sech que ele traz Justamente que
- 00:42:59o limite no máximo é 24.000 o que que é
- 00:43:01legal eu posso clicar também para ver
- 00:43:04cada etapa do processo quanto tempo tá
- 00:43:06levando isso é muito legal porque às
- 00:43:08vezes Ah tem uma etapa que tá demorando
- 00:43:11muito mais que a outra que etapa é essa
- 00:43:13é o Vector search ou não é a parte que
- 00:43:16eu chamo o meu llm se for a parte que eu
- 00:43:18chamo o meu llm por exemplo eu posso
- 00:43:21trocar de modelo falar não esse modelo
- 00:43:23tá muito lento pro meu caso de uso vou
- 00:43:25testar com outro modelo e a assim vai
- 00:43:27todo o meu processo de desenvolvimento
- 00:43:29né então pro desenvolvedor fica muito
- 00:43:31mais simples para avaliar seus
- 00:43:33resultados só que agora não só o
- 00:43:36desenvolvedor precisa avaliar né então a
- 00:43:38gente precisa ter alguns usuários que
- 00:43:41avaliem esse produto né então para isso
- 00:43:43a gente tem o review app que a gente
- 00:43:45cria com simples comando do e Agent
- 00:43:48Framework e ele gera toda uma interface
- 00:43:50visual pra gente tá então o que que a
- 00:43:52gente vai fazer a gente vai acessar o
- 00:43:53nosso modelo né que a gente criou
- 00:43:55registrou ali no un etiquet log a gente
- 00:43:58consegue acompanhar todas as versões
- 00:44:00desse modelo quando que foi registrado
- 00:44:03quem registrou a gente consegue ver ali
- 00:44:06informações mais detalhadas né Inclusive
- 00:44:09a gente consegue ver detalhe daquela
- 00:44:12execução né então qual foi o Notebook
- 00:44:14que gerou esse modelo reg Qual foi o
- 00:44:18tipo de cadeia que foi utilizada os
- 00:44:20artefatos gerados para eu reproduzir até
- 00:44:22em outros lugares né então é muito legal
- 00:44:25quando a gente registra esse modelo aqui
- 00:44:27com o emow E aí o que que a gente pode
- 00:44:30fazer depois documentar né esse esse
- 00:44:32agente colocar ali uma descrição para
- 00:44:34que que ele serve e justamente colocar o
- 00:44:37link desse review app para já ficar tudo
- 00:44:40registrado em um único local e esse link
- 00:44:43pode ser compartilhado com esses
- 00:44:44clientes para fazer o teste ali a gente
- 00:44:46consegue colocar algumas instruções para
- 00:44:48ele fazer esse teste variar as perguntas
- 00:44:52dar o feedback em cada resposta revisar
- 00:44:55os documentos devolvidos para ver se tá
- 00:44:57tudo certo pra gente conseguir avaliar
- 00:44:59para pôr em produção então aí o usuário
- 00:45:02vai vir novamente com a mesma pergunta
- 00:45:04né vai perguntar se pode declarar a
- 00:45:06sogra aqui como dependente E aí ele
- 00:45:09mandando esse resultado ele vai aparecer
- 00:45:11novos botões diferentes do playground né
- 00:45:14justamente pra gente fazer a avaliação
- 00:45:16legal ele tá com a resposta certa mas se
- 00:45:18ele não tivesse né então o que que eu
- 00:45:20poderia fazer então esse usuário que tá
- 00:45:22avaliando ele poderia editar a resposta
- 00:45:25né pra gente ter esse retorno de qual
- 00:45:28seria a resposta certa a gente poderia
- 00:45:30colocar itens de avaliação de feedback
- 00:45:33né que a resposta foi boa ela foi
- 00:45:35acurada relevante profissional poderia
- 00:45:39colocar feedbacks a mais também né
- 00:45:42depois disso eu já consigo ver qual foi
- 00:45:44o documento que ele trouxe né que trouxe
- 00:45:46essa resposta então eu poderia avaliar
- 00:45:48isso também e confirmar né se tá correto
- 00:45:51se não tá depois disso O que que eu
- 00:45:54poderia fazer né então viria ali os
- 00:45:57desenvolvedores analisaria esse teste e
- 00:46:00veria se tá pronto já paraa produção ou
- 00:46:02não né então simplifica todo o processo
- 00:46:05né desde desenvolvimento até mesmo aos
- 00:46:09testes finais antes de entrar em
- 00:46:13produção e agora para vocês conhecerem
- 00:46:16mais duas técnicas muito interessantes
- 00:46:18Vou chamar o Vitinho aqui para falar
- 00:46:19sobre fine tunning e pre-training valeu
- 00:46:22Obrigado Aninha bom a Aninha deu um show
- 00:46:24né gente falando de reg acho que eh uma
- 00:46:28solução como essa ela pode ser aplicada
- 00:46:31em vários contextos dentro da sua
- 00:46:33empresa e eu imagino que isso resolveria
- 00:46:37boa parte do dos problemas que vocês têm
- 00:46:39Talvez hoje e imagino que vocês
- 00:46:41concordem comigo só que a jornada de
- 00:46:43genen ela não para em reg ela continua
- 00:46:46eu diria que reg a gente tá chegando ali
- 00:46:47na metade do caminho né a gente pode
- 00:46:50sofisticar ainda mais essa jornada caso
- 00:46:53seja necessário então a gente viu prompt
- 00:46:56engeneering entendeu muito bem que reg
- 00:46:58traz ali já documentos específicos para
- 00:47:01uma resposta mais acurada só que a gente
- 00:47:03tem agora o conceito de fine tunning
- 00:47:05também E aí vocês devem estar se
- 00:47:07perguntando pô Vitor quando que dentro
- 00:47:09do meu contexto no meu dia a dia eu vou
- 00:47:11saber que eu preciso migrar uma solução
- 00:47:13rag para uma solução de fine tuning vou
- 00:47:16responder vocês já sobre isso mas é
- 00:47:18importante a gente entender que fine
- 00:47:20tuning é a adaptação do modelo
- 00:47:22pré-treino a tarefas ou domínios
- 00:47:25específicos ou seja eu quero que esse
- 00:47:27meu modelo ele seja capaz de entender de
- 00:47:30forma granular de forma especialista
- 00:47:33aquela pergunta que tá sendo feita para
- 00:47:35que ele dê uma resposta de fato acurada
- 00:47:37Quando que você faz essa migração né
- 00:47:39essa virada de chave de reg para fine
- 00:47:42tun o primeiro ponto eu diria que não é
- 00:47:44o principal mas ele tá ali no top três é
- 00:47:46o desempenho e a consistência o fine
- 00:47:48tuning ele tende a oferecer respostas
- 00:47:51mais confiáveis e especializadas que são
- 00:47:54geralmente cruciais para tarefas
- 00:47:56específicas o segundo ponto a latência
- 00:47:58reduzida modelos geralmente que são fine
- 00:48:01tuned eles respondem mais rápido do que
- 00:48:04soluções rag e terceiro ponto aqui é uma
- 00:48:07personalização mais avançada como vocês
- 00:48:08viram o fine tuning ele permite com que
- 00:48:11eu adapte ou Ajuste o meu modelo para
- 00:48:14refletir não só a voz da minha marca
- 00:48:17caso eu queira Mas que ele responda de
- 00:48:18forma condizente com o meu domínio
- 00:48:21específico Então isso é muito
- 00:48:22interessante como a data Bricks ela
- 00:48:24fornece ou ela dá braço para que você
- 00:48:26vocês consigam executar essa tarefa hoje
- 00:48:29dentro da nossa aba de machine learning
- 00:48:32Quando você vai criar um experimento
- 00:48:33você pode hoje criar um fine tuning ou
- 00:48:36um pretraining que eu já explico mais à
- 00:48:38frente para vocês o que é isso tá gated
- 00:48:40Public preview Então se vocês não
- 00:48:41tiverem isso habilitado dentro da
- 00:48:43workspace de vocês entre em contato com
- 00:48:45o nosso time que a gente inscreve vocês
- 00:48:47e faz essa habilitação o processo de
- 00:48:49fine tuning Hoje ele é muito semelhante
- 00:48:50ao processo de aeml Então você vai criar
- 00:48:53um experimento Ali vai selecionar o fine
- 00:48:54tuning as máquinas vão ser provisionadas
- 00:48:57de forma servas para que você utilize e
- 00:49:00posteriormente você vai ter um modelo
- 00:49:01sendo registrado no Unit catalog com
- 00:49:04rastreamento sendo feito com mlflow que
- 00:49:07depois você consegue registrar e fazer a
- 00:49:09implementação desse modelo utilizando
- 00:49:11Model serving veja que aqui e você passa
- 00:49:14por algumas etapas né você vai escolher
- 00:49:16a arquitetura do seu modelo nesse caso
- 00:49:18do fine tuning você precisa trazer os
- 00:49:19seus dados de Treinamento personalizado
- 00:49:22para ir sim fazer o fine tuning
- 00:49:24acontecer e depois finalmente
- 00:49:25disponibilizar isso num Model serving né
- 00:49:28num endp de modelo para que a sua
- 00:49:30aplicação possa consumir esse recurso
- 00:49:33outra etapa que a gente tem e aqui a
- 00:49:35gente chega no maior nível de
- 00:49:36complexidade na jornada de genen é o
- 00:49:39nível mais sofisticado possível é o
- 00:49:41nível de pretraining confesso que eu não
- 00:49:43conheço ainda nenhum cliente no Brasil
- 00:49:45que esteja nesse nível bem e com caso
- 00:49:48público para falar conosco ou falar
- 00:49:50Enfim no mercado aqui a gente tá falando
- 00:49:53de treinar um modelo de genen do zero
- 00:49:56para um domínio ou um contexto
- 00:49:58específico ou seja é um treinamento de
- 00:50:00um modelo fundacional a gente vai
- 00:50:03precisar aqui de alguns milhões bilhões
- 00:50:06trilhões de tokens para fazer o
- 00:50:08treinamento desse modelo ah Vitor isso
- 00:50:10daí é rápido cara a gente não tá falando
- 00:50:13de poucos dias a gente tá falando de
- 00:50:14muitas semanas talvez alguns meses para
- 00:50:17conseguir executar isso e finalmente
- 00:50:19chegar na obra ali da Ópera final né da
- 00:50:22da arte final com sucesso vantagens
- 00:50:25controle completo é é um modelo seu você
- 00:50:28criou esse modelo então é um modelo que
- 00:50:30ninguém mais no mercado nunca vai ter
- 00:50:32nada parecido com o que você tem
- 00:50:34considerações é um processo complexo
- 00:50:36então pode ser extremamente Custoso
- 00:50:39fazer isso do zero quem hoje tá
- 00:50:41aplicando isso muito bem e fazendo com
- 00:50:43sucesso e esse é um ponto que eu queria
- 00:50:45compartilhar com vocês acho que o caso
- 00:50:47mais legal para ser compartilhado com
- 00:50:48vocês é o caso da Bloomberg a Bloomberg
- 00:50:51ela criou ali eh em cima dos dados de 40
- 00:50:55anos de do setor financeiro né dados
- 00:50:57financeiros que eles tinham para criar o
- 00:50:59que eles chamam de Bloomberg GPT que é
- 00:51:02basicamente um assistente que sabe
- 00:51:04responder qualquer pergunta relacionada
- 00:51:06ao mundo financeiro aí vocês devem estar
- 00:51:09falando pô Vitor mas demorou mesmo para
- 00:51:11fazer esse Bloomberg GPT ess assistente
- 00:51:13da Bloomberg só para vocês terem ideia a
- 00:51:15gente tá falando de
- 00:51:17aproximadamente 700 bilhões de tokens
- 00:51:20para treinamento vocês lembram quando a
- 00:51:23Aninha apresentou os fundamentos pra
- 00:51:24gente que o token era uma palavra um
- 00:51:26conjunto de palavras imagina 700 bilhões
- 00:51:30de tokens quantos documentos e quantas
- 00:51:32análises de texto não foram feitas aí
- 00:51:35vocês devem se perguntar Ah vctor esse
- 00:51:36modelo da Bloomberg quantos dias demorou
- 00:51:38para eles treinarem esse modelo e chegar
- 00:51:40na obra da arte final foram 48 dias sem
- 00:51:45a máquina desligar em nenhum momento
- 00:51:47então Imaginem aqui a complexidade e a
- 00:51:50sofisticação que um processo desse tem
- 00:51:53demonstração né como vocês podem
- 00:51:55alcançar esse sucesso dentro da
- 00:51:57plataforma datab Bricks é bem simples na
- 00:51:59workspace dentro da aba de machine
- 00:52:01learning você tem ali Os experimentos
- 00:52:03pra galera que tá acostumada a modelar
- 00:52:04aqui não tem muito segredo e ali dentro
- 00:52:06vocês têm a opção né lá em cima do lado
- 00:52:09de aut Emil mosaic ai Model Training
- 00:52:11quando vocês clicam nessa opção vocês
- 00:52:13vão ver que vocês TM duas opções aqui
- 00:52:15via interface do usuário tudo isso é
- 00:52:17replicável via código também você
- 00:52:19seleciona se você quer fazer um fine
- 00:52:21tunning ou se você gostaria de fazer um
- 00:52:23pretraining e dali você consegue iniciar
- 00:52:26sua jornada se você tá nessa fase da
- 00:52:28jornada de genen e tem mais interesse em
- 00:52:31conhecer mais profundamente os materiais
- 00:52:33que a gente tem entra em contato conosco
- 00:52:35assim que acabar o webinar e a gente
- 00:52:37pode sentar e fazer um Deep diive em
- 00:52:39cima dentro desses dois tópicos para que
- 00:52:41vocês conheçam de fato tudo que a gente
- 00:52:43tem debaixo do capô do carro dito isso
- 00:52:45Promessa é dívida né a gente tem aqui
- 00:52:47mais alguns minutos antes de encerrar o
- 00:52:48webinar a gente tem agora o grande caso
- 00:52:50de uso de sucesso e que é público que
- 00:52:53nós aqui time data Breaks temos muito
- 00:52:55orgulho e gostaríamos de apresentar para
- 00:52:57vocês vou passar a palavra pra Ana e a
- 00:52:58Ana vai apresentar Quem é esse fatídico
- 00:53:01cliente para vocês então vamos lá
- 00:53:03pitinho muito legal né a gente saber
- 00:53:06onde a gente pode chegar na jornada de
- 00:53:08Jen né então trabalhando com dat Break
- 00:53:11Vocês conseguem trabalhar desde do do
- 00:53:13prompt Engineering trabalhar com reg e
- 00:53:16se um dia vocês precisarem né trabalhar
- 00:53:17com f tan PR Training vocês sabem que
- 00:53:20tem uma plataforma completa para isso e
- 00:53:22não só isso né utilizar também qualquer
- 00:53:24modelo que vocês precisarem mas agora
- 00:53:26orora vamos ver na prática como nossos
- 00:53:28clientes estão tendo sucesso com essas
- 00:53:30soluções né e o cliente tão esperado que
- 00:53:32a gente trouxe aqui para vocês é a arezo
- 00:53:35en co né Então primeiramente eu gostaria
- 00:53:38de agradecer tanto o Guilherme quanto o
- 00:53:40Murilo por terem compartilhado esse
- 00:53:42super casa de uso no nosso evento em
- 00:53:44agosto desse ano né o dat en Tour São
- 00:53:46Paulo e agradecer também por permitirem
- 00:53:49que a gente apresentasse hoje aqui para
- 00:53:51vocês e também parabenizar todos
- 00:53:53envolvidos nesse caso de sucesso tanto o
- 00:53:55time do data Bricks quanto o Tim da Arez
- 00:53:57enc né E esse caso né da Arez enc né que
- 00:54:01inclusive eu sou super fã deles né eu
- 00:54:03tenho vários produtos da marca mas para
- 00:54:06quem não conhece a Ares é uma das
- 00:54:08maiores House of brands do Brasil ela
- 00:54:10tem mais de 17 marcas e quase 6 milhões
- 00:54:13de clientes né então é uma empresa super
- 00:54:16grande e a marca escolhida para ser
- 00:54:19trabalhada nesse projeto justamente foi
- 00:54:21a arezo né a grande marca de calçados e
- 00:54:23acessórios femininos com milhares de l
- 00:54:26lojas pelo Brasil né e qual que foi né
- 00:54:29esse caso de uso né hoje já narzo todas
- 00:54:32as vendedoras já tem na palma da sua mão
- 00:54:35o zzp né que ele é um aplicativo que
- 00:54:38elas usam para se comunicar com as
- 00:54:39clientes onde por trás tem vários vários
- 00:54:43modelos de a né que traz um diferencial
- 00:54:45pra sua cliente porque consegue tanto
- 00:54:48trazer um atendimento personalizado e
- 00:54:50até mesmo várias recomendações Com base
- 00:54:53no uso e no gosto delas né E aí para
- 00:54:56para elevar essa experiência do cliente
- 00:54:58em um novo patamar eles adicionaram uma
- 00:55:00funcionalidade muito bacana que foi
- 00:55:03desenvolvida justamente para atender os
- 00:55:05clientes que acabam chegando na loja né
- 00:55:08com a foto de algum calçado que gostaram
- 00:55:11isso até já aconteceu comigo e até mesmo
- 00:55:14né ou até mesmo vira um produto ali na
- 00:55:16loja e não tinha um produto no seu
- 00:55:19número então qual que é a ideia é a
- 00:55:21vendedora pegar esse sapato que a
- 00:55:23cliente gostou e não tem o número dela
- 00:55:25ela tira essa essa foto e na hora que
- 00:55:27essa foto é tirada já faz uma busca em
- 00:55:30todo o seu estoque para encontrar os
- 00:55:33sapatos mais semelhantes com aquele que
- 00:55:35a cliente Gostou né então isso foi muito
- 00:55:39legal porque foi implementado ali
- 00:55:41modelos utilizando o Model serving com
- 00:55:44conexão com Open ai e essas imagens
- 00:55:47foram indexadas utilizando o Vector
- 00:55:49search que a gente falou bastante aqui
- 00:55:50nas apresentações justamente para
- 00:55:52realizar essa busca por similaridade né
- 00:55:55esse produto que a cliente quer com a
- 00:55:57base do estoque né e o que o é legal que
- 00:56:00o resultado foi muito incrível gente
- 00:56:02isso é um produto super novo e a gente
- 00:56:04já consegue ver dados muito expressivos
- 00:56:07né então em teste de 12 meses nas lojas
- 00:56:10participantes Eles já tiveram uma
- 00:56:12receita incremental de quase R 70
- 00:56:14milhões deais diminuíram em 9% o estoque
- 00:56:18médio e a conversão de clientes
- 00:56:20atendidos né Por recomendação que é a
- 00:56:23cliente entrar na loja e comprar o
- 00:56:25produto foi já de quase 4% a mais né
- 00:56:29então a gente vê que a ia generativa ela
- 00:56:32é um Case são cases muito legais que
- 00:56:34atendem tanto o cliente final quanto a
- 00:56:37empresa né a gente vê Olha esses números
- 00:56:39que impactantes né Então esse é só um
- 00:56:41dos casos que a gente já tem diversos ao
- 00:56:44redor do mundo então Caso vocês tenham
- 00:56:46curiosidade de saber outros casos de uso
- 00:56:49na prática que estão acontecendo com os
- 00:56:51nossos clientes a gente vai deixar aqui
- 00:56:53um Carry code né esse primeiro Carry
- 00:56:55code na esquerda então lá Vocês
- 00:56:57conseguem ver vários casos de uso com i
- 00:56:59generativa para quem quiser se
- 00:57:00especializar Ah eu gostei dessa área é
- 00:57:03isso que eu quero seguir entrem nesse
- 00:57:05site O que é genen aqui do dat Bricks
- 00:57:08que tem toda a explicação que a gente
- 00:57:09deu aqui no material de forma mais
- 00:57:11aprofundada com diversos links links
- 00:57:13para curso do Academy links para
- 00:57:15certificação né para tirar acreditação e
- 00:57:18também quem quiser já fazer algum
- 00:57:20tutoriais a gente tem esse outro Carry
- 00:57:22code para vocês fazerem tutoriais e já
- 00:57:24começarem colocar a mão na massa tá e
- 00:57:27pessoal um ponto muito importante né
- 00:57:29então Caso vocês tenham algum caso de
- 00:57:31uso né que vocês não sabem como começar
- 00:57:34gostariam do apoio da det Bricks tanto
- 00:57:36na questão de arquitetura na questão de
- 00:57:39orientação quando vocês saírem do
- 00:57:41webinar vai aparecer algumas perguntas
- 00:57:44bem pouquinhas coloquem lá as
- 00:57:46informações Caso vocês tenham algum caso
- 00:57:48de uso que precisem da nossa ajuda
- 00:57:49porque a gente vai entrar em contato com
- 00:57:51vocês para fazer vocês também se
- 00:57:53tornarem um caso de sucesso e aparecer
- 00:57:55aqui nos próximos abinar também então
- 00:57:57contem com a gente nessa jornada pessoal
- 00:58:00muito obrigada pela participação de
- 00:58:02todos não se esqueçam de inscrever se
- 00:58:04inscrever nos próximos webinares e
- 00:58:06contem com a gente nessa jornada
- 00:58:08Obrigada pessoal Tenha um bom dia valeu
- 00:58:11pessoal boa quarta-feira para vocês
- 00:58:13tchau tchau
- webinar
- Databricks
- inteligência artificial
- machine learning
- LLM
- Lakehouse
- ai generativa