00:00:00
meu nome é alexandre eu sou professor da
00:00:02
faculdade de saúde pública da usp a na
00:00:04
área de estatísticas de saúde né
00:00:07
essência de dados
00:00:09
eu sou originalmente economista e
00:00:12
fascinado por pela questão da análise de
00:00:15
dados principalmente na área da saúde
00:00:16
que é uma área tão cheia de imperfeições
00:00:18
de mercados e novas novas interesses
00:00:23
científicos a serem abordados com a
00:00:25
análise de dados
00:00:26
bem vindos ao curso de inteligência
00:00:28
artificial com foco na área da saúde
00:00:30
a gente vai falar sobre bastante o
00:00:31
comércio online as possibilidades de
00:00:34
machine as aplicações técnicas de marchi
00:00:36
lane
00:00:37
a gente vai começar desde o início neder
00:00:40
e como rodar modelos de mach lane né
00:00:43
principalmente como inserir variáveis o
00:00:45
que fazer com essas variáveis quais
00:00:47
variáveis importantes a gente vai falar
00:00:49
sobre todas as técnicas iniciais de de
00:00:52
pré processamento de dados
00:00:54
daí vamos falar sobre os modelos de um
00:00:56
machinho lane aí no fim vamos terminar
00:00:59
atestando a qualidade desses modelos
00:01:01
então você o curso que vai do início ao
00:01:03
fim de mach lane
00:01:05
então vai ser uma parte essa parte vai
00:01:07
ser bastante técnica com a gente vai
00:01:08
também vai ter parte mais gerais né
00:01:11
principalmente no início pra explicar às
00:01:13
pessoas que não conhece o que é
00:01:15
essencial é explicar um pouco o que é
00:01:17
possível dentro da área e desmistifique
00:01:20
desmistificar um pouco essa história de
00:01:23
inteligência artificial que parece uma
00:01:24
coisa muito distante para muitas pessoas
00:01:27
mas que já é uma realidade hoje a
00:01:29
eficiência e é uma realidade hoje cada
00:01:32
vez mais nas indústrias e nas empresas
00:01:34
tá então bem vindo ao curso espero que
00:01:37
todo mundo tenha bastante proveito com
00:01:39
esse com esse curso é que é uma área que
00:01:41
hoje é como vocês sabem tatá explodindo
00:01:45
muitas pessoas a acham que essa explosão
00:01:48
do interesse e inteligência artificial
00:01:51
às vezes é uma coisa criada pela mídia é
00:01:53
porque porque porque hoje você abre
00:01:56
qualquer jornal você assistir qualquer
00:01:58
canal de tv você abre qualquer revista
00:02:00
vai ter alguma coisa de inteligência
00:02:02
artificial ea área que domina hoje a
00:02:04
agência oficial que é machina online
00:02:07
então muita gente pergunta assistindo ao
00:02:09
hype criado pela mídia
00:02:11
tá eu estou aqui primeiro lugar para
00:02:13
admitir
00:02:13
cá isso e dizer que não tá então
00:02:15
inteligência artificial é uma realidade
00:02:17
hoje ela está presente na nossa vida
00:02:20
muito mais que as pessoas sabem que as
00:02:22
pessoas pensam
00:02:24
tá e porque e na verdade esse hype da
00:02:27
mídia é uma consequência do nosso avanço
00:02:30
ataque tenha ocorrido na área na área da
00:02:32
ciência na área da da empresa então a
00:02:35
mídia está começando a se dar conta
00:02:37
dessas mudanças que estão acontecendo
00:02:39
a nossa área e por que tá acontecendo
00:02:42
essas mudanças nos últimos cinco dez
00:02:44
anos são por três fatores principais
00:02:47
em primeiro lugar à direita
00:02:50
então a gente nunca teve tantos dados
00:02:52
disponíveis para treinar os nossos
00:02:54
modelos de machine
00:02:55
aí a gente vai ver que esses modelos de
00:02:58
fato necessita de muitos dados
00:03:00
ao contrário da gente que aprende coisas
00:03:02
novas já tem uma noção da realidade os
00:03:04
modelos estão aprendendo 02 opção de
00:03:06
muitos dados
00:03:07
em segundo lugar capacidade
00:03:09
computacional
00:03:10
então finalmente os computadores novos
00:03:12
modelos ainda leva muito tempo a rodar é
00:03:15
um dos modelos mais complexos que nós
00:03:17
fazemos no meu laboratório vou falar um
00:03:20
pouco sobre sobre ele que o lobby da
00:03:21
pepsi
00:03:22
eles ainda levam bastante tempo mas cada
00:03:24
vez menos tempo com os alunos
00:03:26
computacionais e principalmente os
00:03:28
avanços na área de gpu que tem permitido
00:03:31
rodar modelos de plano em cada vez mais
00:03:34
rápidos e terceiro lugar
00:03:36
o desenvolvimento técnico da o
00:03:39
aparecimento de novos algoritmos the
00:03:41
machine
00:03:42
muitos desses algoritmos the machine já
00:03:44
existem há muito tempo desde a década de
00:03:46
60 70 e 80 mas alguns deles são
00:03:49
relativamente novos e algumas pequenos
00:03:52
ajustes têm ocorrido umas pequenas
00:03:55
inovações de ajustes a de parafusos aqui
00:03:59
e ali técnicas de otimização a para a
00:04:03
paralisação a função de perda diferente
00:04:07
então a gente está sendo alguns avanços
00:04:09
técnicos e nos últimos anos
00:04:10
principalmente nessa área está cada vez
00:04:12
mais forte e mash lane que a gente vai
00:04:15
falar no curso que é de plani então só
00:04:18
para deixar claro esse crescimento da
00:04:20
área
00:04:21
hoje a demanda por profissionais de
00:04:23
saúde profissionais que sabem analisar
00:04:26
machine lane
00:04:27
há muitas muitas vezes na área da saúde
00:04:29
é gigantesca hoje tá então hoje as
00:04:32
empresas estão de fato pagando salários
00:04:34
milionários para especialistas em
00:04:36
marketing online e é uma das áreas mais
00:04:37
quentes do momento
00:04:39
aí as empresas não estão conseguindo
00:04:40
preencher essas vagas porque devido à
00:04:43
falta a de profissionais da área é
00:04:46
demanda por profissionais na área
00:04:47
científica também está bastante alta
00:04:49
como a gente vê todos os dias no meu
00:04:52
laboratório então pesquisa do do
00:04:54
linkedin o link faça pesquisa todo ano é
00:04:57
das várias habilidades que você consegue
00:04:59
colocar o currículo do linkedin com a
00:05:02
habilidade que conseguem emprego mais
00:05:04
rapidamente
00:05:06
tá e todos os anos no brasil há já
00:05:08
vários anos é a análise de dados
00:05:10
então você ter habilidade e analisar
00:05:13
dados é a tua habilidade que consegue um
00:05:15
emprego mais rapidamente e o emprego de
00:05:18
qualidade mais rapidamente porque eu
00:05:21
quis deixar isso claro nessa demanda que
00:05:23
já se demanda porque se você tiver
00:05:26
trabalhando em uma empresa que não está
00:05:29
de acordo com os padrões éticos
00:05:32
você precisa sair dessa empresa a
00:05:34
demanda profissionais de marketing
00:05:35
online é muito alta hoje e você não
00:05:38
precisa participar dessas dessas
00:05:39
empresas
00:05:40
então a gente vai usar uma finlândia
00:05:42
para o bem vamos fazer muita coisa a
00:05:44
positiva provas a humanidade como a
00:05:47
finlândia mas algumas empresas vão usar
00:05:49
uma senha única coisa errada
00:05:50
a gente tem muita empresa hoje é que
00:05:53
finge que está aqui objetivo é conectar
00:05:55
o mundo não é na verdade está
00:05:56
manipulando voto estão manipulando
00:05:58
sentimento já existem hoje empresas que
00:06:01
utilizam uma chicane para vigilância de
00:06:04
funcionários em fábricas por exemplo a
00:06:06
gente hoje empresas que estão usando uma
00:06:08
china que alimenta a limitar o acesso a
00:06:11
bens e serviços a pessoas com
00:06:13
necessidades
00:06:14
se você está trabalhando em alguma das
00:06:15
empresas você precisa sair da empresa
00:06:17
a demanda pelo seu trabalho é muito
00:06:19
grande você vai conseguir emprego muito
00:06:21
bom fora dessas áreas não contribua à
00:06:23
para essas a pressa as empresas e por
00:06:27
outro lado há muitas empresas numa
00:06:28
chicane para o bem
00:06:30
dá pra fazer grandes mudanças positivas
00:06:32
na sociedade como por exemplo o google
00:06:34
está usando machiline para evitar
00:06:37
diminuir o desmatamento da amazônia
00:06:39
sim existem
00:06:41
a empresa várias pesquisas melhorando o
00:06:43
trânsito nas cidades mas sim lane para
00:06:45
melhorar o trânsito nas grandes cidades
00:06:46
e desenvolvimento em tecnologias verdes
00:06:48
nec nosso laboratório a gente usa para
00:06:51
melhorar a situação de saúde do brasil é
00:06:54
melhorar políticas públicas e melhorar o
00:06:57
diagnóstico dos pacientes etc
00:06:59
então tem muita coisa boa ter feito em
00:07:01
washington de começar o curso que deixar
00:07:03
isso claro para você se torna essa
00:07:04
empresa não precisa dessa empresa
00:07:06
a demanda por você é muito grande ver
00:07:07
contribuir para para o bem da sociedade
00:07:10
como shane que é uma que é uma técnica
00:07:12
uma ferramenta muito poderosa para ser
00:07:15
usado para coisas pra coisas erradas
00:07:17
então na área acadêmica que tipo de na
00:07:20
área de pesquisa científica que tipo de
00:07:21
estudo estão aparecendo que já usam mexe
00:07:24
lane por exemplo um estudo publicado há
00:07:26
o site teve como objetivo para dizer a
00:07:30
presença de transtorno de estresse pós
00:07:32
traumático
00:07:33
utilizando dados de 24 países incluindo
00:07:36
o brasil totalizando cerca de 69 mil
00:07:39
indivíduos
00:07:40
a prevalência do transtorno é
00:07:42
relativamente baixo à população cerca de
00:07:44
4%
00:07:45
então qual foi o objetivo do estudo pra
00:07:47
dizer baseado em várias variáveis por
00:07:50
editoras como sócio demográficas
00:07:52
distúrbios mentais tipo de evento
00:07:54
traumático é certa quem provavelmente a
00:07:57
a desenvolver transtorno de estresse pós
00:07:59
traumático
00:08:00
eles usaram o super lana que o algoritmo
00:08:02
de the machine e o que encontraram que
00:08:05
os 10% de pessoas que o algoritmo falava
00:08:08
que tinha maior risco incluíam
00:08:11
praticamente todas as pessoas 95 por
00:08:13
cento e noventa e cinco a seis por cento
00:08:15
das pessoas que de fato tinha dois na
00:08:18
então imaginem uma aplicação prática no
00:08:21
hospital já que tem um limite de
00:08:22
atendimentos a priorizar alguns
00:08:24
pacientes prioriza esses 10% apenas você
00:08:28
vai ter praticamente todo mundo aqui vai
00:08:31
ter esse esse transtorno os 10% que o
00:08:33
algoritmo fala que tem maior risco
00:08:34
incluem basicamente todo mundo que vai
00:08:37
desenvolver esse transtorno
00:08:38
outro artigo recente que sair esse ano a
00:08:41
procurou para dizer quais mulheres
00:08:44
grávidas tinham maior risco de ter um
00:08:47
evento adverso no parto que seria esse
00:08:50
evento adverso filho prematuro combate
00:08:54
peso ou internação na uti ea morte no
00:08:56
primeiro ano tá aí pra que isso para
00:08:59
orientar a inscrição no bar bar tal
00:09:01
tucanos que é o programa nos estados
00:09:03
unidos de prevenção já que ajuda a
00:09:05
gravidade a previne a o desenvolvimento
00:09:08
desses desses problemas adversa
00:09:10
nascimento
00:09:11
eles testaram quatro algoritmos the
00:09:13
machine lane para predizer risco de
00:09:15
parto adverso e compararam com a regra
00:09:18
anterior
00:09:19
a regra anterior a gente vê muito isso
00:09:20
serviço de saúde e às vezes tem umas
00:09:22
regras para a tomada de são luís são
00:09:25
muito simples e que a china está
00:09:27
trazendo tá melhorando os critérios de
00:09:30
inclusão nos programas
00:09:32
então existe uma regra que 17 fatores de
00:09:34
risco se tivesse 2 a pessoa incluída no
00:09:37
programa
00:09:38
daí que os algoritmos mostraram que eles
00:09:40
têm muito melhor capacidade preditiva de
00:09:42
quem vai ter esse evento adverso do que
00:09:44
essa regra anterior tha e os autores
00:09:47
chegaram à conclusão que a cada duas mil
00:09:49
mulheres o algoritmo incluiria mais 170
00:09:51
mulheres que de fato eu te desfecho
00:09:54
adverso no parto
00:09:55
então você inclui muito mais as pessoas
00:09:57
que de fato você ia conseguir prevenir
00:10:00
esses problemas no parto
00:10:02
eu falei dos artigos científicos agora
00:10:04
falar um pouco sobre o nosso laboratório
00:10:05
que a oab da pepsi laboratório de big
00:10:08
data e análise preditiva em saúde da
00:10:11
faculdade de saúde pública da usp
00:10:13
apesar da enorme crise dada ciência que
00:10:15
a gente vive hoje a gente tem o
00:10:17
financiamento a gente a sorte o
00:10:18
financiamento da fapesp cnpq da e da
00:10:21
fundação lemann a e que tipo de
00:10:23
perguntas ele está respondendo nosso
00:10:25
tentando responder nosso laboratório
00:10:26
está em primeiro lugar é possível
00:10:30
predizer como boa a qualidade preditiva
00:10:33
quem vai morrer em breve
00:10:35
e por qual causa a pessoa vai morrer que
00:10:37
é uma das grandes questões da
00:10:39
epidemiologia desde os clássicos estudos
00:10:41
de um grau de 1.662 que ele procurava
00:10:44
ver quais fatores estão associados ao
00:10:47
óbito nos próximos anos a probabilidade
00:10:50
de óbito porque isso é importante pra
00:10:53
gente conseguir determinar que essa
00:10:54
pessoa tem alta probabilidade de ter um
00:10:57
infarto por exemplo eu tenho um derrame
00:10:59
por exemplo a gente consegue iniciar
00:11:01
medidas preventivas a com bastante
00:11:04
antecedência ea gente descobriu né
00:11:07
as pesquisas recentes que isso é um
00:11:09
problema resolvido
00:11:10
então mesmo com poucos dados ea gente
00:11:12
tem um tutorial a e publicação né o
00:11:15
tutorial de uso de machine com foco em
00:11:18
prevenção de óbitos em idosos que a
00:11:20
gente consegue predizer relativamente
00:11:22
bem mesmo com poucos dados que vai
00:11:24
morrer nos próximos cinco anos
00:11:26
é principalmente idosos ea gente
00:11:27
conseguiu agora acesso a um banco de
00:11:29
dados bastante grande da inglaterra que
00:11:32
a gente está bastante otimista que a
00:11:34
gente vai conseguir não só para dizer
00:11:36
que vai morrer mas também por qual causa
00:11:38
de obras que as pessoas vão morrer outro
00:11:40
outro desafio que a gente está tentando
00:11:41
abordar a predizer qualidade de vida
00:11:44
futura em pacientes com doenças graves
00:11:48
então a gente está analisando uma mostra
00:11:51
uma pesquisa do hospital do coração hcor
00:11:53
é que eles fizeram um estudo com
00:11:56
pacientes com câncer internados não tem
00:11:59
orientado para dizer esse paciente que
00:12:02
são graves a paciente com câncer
00:12:03
internados na uti é quanto tempo de
00:12:05
qualidade de vida eles têm pela frente é
00:12:09
porque isso é importante pra pensar em
00:12:11
orientar cuidados paliativos
00:12:13
então os pacientes têm poucos dias
00:12:15
poucas semanas pouco apenas um mês por
00:12:17
exemplo de qualidade de vida pela frente
00:12:19
dá essa possibilidade do paciente e
00:12:22
profissional de saúde tomar essa decisão
00:12:25
você quer continuar hospital ou você
00:12:27
quer passar os últimos dias tentando
00:12:29
melhorar de minerador melhorar a
00:12:31
qualidade de vida na sua casa com seus
00:12:33
familiares seus amigos
00:12:34
em terceiro lugar a outro outro grande
00:12:38
desafio do nosso laboratório identificar
00:12:40
boas práticas de políticas públicas em
00:12:43
saúde a identificar quais municípios
00:12:45
brasileiros estão tendo uma boa gestão e
00:12:48
saúde o que é bastante difícil né então
00:12:51
como é que realmente você vê é bastante
00:12:53
na mídia nos jornais um ranking é
00:12:56
normalmente de por exemplo expectativa
00:12:58
de vida
00:12:59
então fica implícito que o município com
00:13:01
maior expectativa de vida tem a melhor
00:13:04
de sua saúde e seu absurdo
00:13:06
daí porque que os municípios mais ricos
00:13:08
vão ter melhor expectativa de vida
00:13:11
então isso é simplesmente um ranking de
00:13:13
riqueza dos municípios no ranking de
00:13:15
qualidade de gestão e saúde
00:13:16
a gente tava na área da saúde a gente
00:13:18
sabe muito bem que fatores
00:13:19
socioeconômicos
00:13:21
fundamentais pra ver a qualidade de
00:13:24
saúde da população
00:13:25
então o que a gente está fazendo com o
00:13:27
conheço tudo no meu lugar
00:13:29
a gente está tentando predizer na
00:13:31
testado é possível predizer qual é a
00:13:35
expectativa de vida dos municípios
00:13:37
brasileiros sem usar informações saúde
00:13:41
só usando informação sócio econômica e
00:13:43
demográfica
00:13:45
então por exemplo dada a renda desse
00:13:47
município o desemprego desse município a
00:13:51
aaa escolaridade esse município de
00:13:54
certas você tem 60 variáveis do nosso
00:13:56
algoritmo consegue falar o município com
00:13:58
as características tem expectativa de
00:14:00
vida de 73 5 a 2 ea gente olhar de fato
00:14:03
e 73 dos ladrões eu vou mostrar pra
00:14:04
vocês que a gente consegue
00:14:06
tá e daí a gente entra no segundo
00:14:07
desafio que é por mais um município a 7
00:14:11
mas tão anti ele erra alguns casos
00:14:13
alguns municípios vão melhor do que
00:14:15
deveriam ir do que a predição eu sou
00:14:19
melhor do que eles deveriam ir que a
00:14:20
gente chama de owach vers
00:14:22
a gente está chamando esse estudo de
00:14:23
ovar ativas a gente entra nessa segunda
00:14:25
fase depois que identificar o que estou
00:14:28
ativos diferem do sandero artigos
00:14:30
municípios que vão pior do que o nosso
00:14:32
algoritmo disse que ele deveria ir aí
00:14:35
sim comparar a situação de saúde para
00:14:36
ver boas práticas de políticas públicas
00:14:39
tá então primeiro lugar a gente mostra
00:14:42
que consegue predizer com boa
00:14:43
performance
00:14:44
a expectativa de vida dos municípios
00:14:46
então aqui né no gráfico se conseguem
00:14:48
ver que a medida que nosso algoritmo
00:14:51
fala que até que a expectativa de vida
00:14:54
deve ser alta a gente vai lá cheque de
00:14:55
fato é alto o nosso objetivo fala que
00:14:57
deve ser baixa a gente checa de fato é
00:14:59
baixo quando ele comete em geral poucos
00:15:01
erros mas mesmo assim tem alguns outline
00:15:04
em alguns municípios que o nosso
00:15:05
algoritmo é bom ou melhor que o esperado
00:15:07
ou pior que o esperado ea gente entra na
00:15:09
segunda fase que já adianto para vocês
00:15:11
nosso artigo está em fase final de
00:15:13
revisão em uma revista científica
00:15:16
aí que a gente encontrou que houver
00:15:18
tiver se investem mais em atenção
00:15:21
primária à saúde
00:15:23
então são os municípios que têm mais
00:15:25
tato é só da família passa o município
00:15:27
tem mais base na ação
00:15:30
são municípios têm mais programas
00:15:32
federais de saúde e odontológico por
00:15:34
exemplo
00:15:34
tá isso é o resultado que a gente
00:15:36
esperava a gente ficou muito feliz no
00:15:39
fim é porque isso confirmou que os
00:15:40
outros estudos têm mostrado com uma
00:15:42
técnica totalmente diferente do que tem
00:15:44
sido feito até hoje
00:15:45
e mais o mais interessante disso é que a
00:15:48
gente viu que o sandro ativas ou seja os
00:15:50
municípios que vão pior do que deveriam
00:15:52
ir do que o nosso algoritmo prediz que
00:15:54
ele iria também investe em saúde e são
00:15:57
melhores em algumas áreas mas em atenção
00:16:00
secundário
00:16:01
tá então são municípios que têm mais
00:16:03
máquinas de raio x do que os outros
00:16:06
são municípios que fazem mais seis áreas
00:16:08
do que os outros municípios que fazer
00:16:10
mais uma monografia do que os outros já
00:16:12
então interessante aqui de fato eles
00:16:14
estão também investindo em saúde mas tem
00:16:16
investido em áreas com o retorno
00:16:18
marginal menor
00:16:19
esses são alguns exemplos de pesquisas
00:16:21
na área pesquisas de outros grupos e
00:16:23
nosso grupo mas como
00:16:25
além desse existem milhares de outros
00:16:28
grupos do mundo né fazendo essas
00:16:30
pesquisas agora trabalhando isso agora
00:16:32
mandando os ativos agora então é uma
00:16:34
área da saúde relativamente nova que
00:16:37
está explodindo agora num no máximo no
00:16:39
último ano que é quando a gente entrou
00:16:41
também nessa área
00:16:48
[Música]