00:00:03
O mundo em que vivemos está repleto
de dados que chovem por todos os lados.
00:00:10
Sozinhos, esses dados são apenas
barulho e confusão.
00:00:14
Para dar sentido a eles, achar significado,
00:00:18
precisamos de um ramo poderoso
da ciência - estatística.
00:00:22
Acredite em mim, não tem nada de
chato nas estatísticas.
00:00:26
Especialmente hoje em dia,
quando podemos fazer os dados cantarem.
00:00:29
Com a estatística podemos
realmente entender o mundo.
00:00:33
E tem mais.
00:00:35
Com a estatística, o dilúvio de dados,
como é chamada, está nos levando
00:00:40
a um maior entendimento da vida
na Terra e no universo afora.
00:00:46
E graças ao incrível poder
dos computadores modernos,
00:00:50
ela pode ser fundamental para transformar
o processo de descoberta científica.
00:00:57
Sem brincadeira, a estatística é
agora o assunto mais sexy que existe.
00:01:23
Você sabia que existem
um milhão de barcos na Suécia?
00:01:25
Isso dá um barco a cada 9 pessoas!
00:01:27
É o número mais alto de
barcos por pessoa da Europa.
00:01:31
A Suécia também tem o
maior número de McDonalds,
00:01:34
computadores e reatores
nucleares por pessoa da Europa.
00:01:41
Os estatísticos geralmente não gostam
de dizer sua profissão numa festa.
00:01:45
Mas na verdade,
os estatísticos não deveriam se envergonhar
00:01:48
porque todos querem
entender o que está acontecendo.
00:01:51
E a estatística nos dá
perspectiva sobre o mundo em que vivemos
00:01:56
que não poderíamos ter de outro modo.
00:02:00
As pessoas passam em média
24 anos de suas vidas dormindo.
00:02:04
As estatísticas nos dizem se as coisas que
pensamos e acreditamos são mesmo verdade.
00:02:10
A maiora dos homens acham
que dirigem melhor que as mulheres.
00:02:14
Mas têm em média o dobro de
acidentes fatais por km dirigido.
00:02:20
E as estatísticas são muito mais úteis
do que geralmente gostamos de admitir.
00:02:25
Na última recessão, houve essa famosa
ligação para um talk-show no rádio.
00:02:29
O homem reclamou,
"Em tempos como esses, quando
00:02:33
o desemprego está em 13%,
a renda baixou 5%",
00:02:37
"e com índices de suicídio subindo, eu fico
muito revoltado quando o governo"
00:02:41
"está desperdiçando dinheiro em coisas como
coleta de estatísticas."
00:02:48
Eu não sou oficialmente um estatístico.
00:02:50
Sendo rigoroso,
o meu campo é saúde global.
00:02:58
Mas eu me tornei obcecado com estatísticas
quando percebi o quanto as pessoas
00:03:03
na Suécia não conheciam
a respeito do resto do mundo.
00:03:06
Eu comecei na nossa universidade
médica, Karolinska Institutet,
00:03:10
num curso de graduação
chamado Saúde Global.
00:03:13
Esses estudantes vindo até nós
tinham as notas mais altas
00:03:17
no sistema de ensino sueco,
00:03:18
então eu pensei, "Talvez eles já saibam
tudo o que eu tenho para ensiná-los".
00:03:22
Então eu fiz um pré-teste quando
eles chegaram, e uma das questões
00:03:25
que me ensinaram muito
foi a seguinte
00:03:28
qual país tem a taxa mais alta de
mortalidade infantil desses 5 pares?
00:03:32
Eu não vou testá-los,
mas é a Turquia
00:03:34
que tem o mais alto aqui, Polônia,
00:03:37
Russia, Paquistão, and África do Sul.
00:03:40
E esse foi o resultado
dos estudantes suecos.
00:03:43
1.8 respostas certas de 5 possíveis.
00:03:44
E isso significa que existe
lugar para um professor
00:03:47
de Saúde Internacional
e para o meu curso.
00:03:49
Mas uma noite eu estava compilando
o relatório, e fiz a minha descoberta.
00:03:56
Eu mostrei que os melhores estudantes
da Suécia sabem estatisticamente
00:04:00
menos sobre o mundo
que os chimpanzés.
00:04:06
Porque os chimpanzés acertariam a metade.
00:04:09
Se eu oferecesse duas bananas
escrito Sri Lanka e Turquia,
00:04:12
eles escolheriam a certa na metade dos
casos, mas os estudantes não chegaram lá.
00:04:15
Eu também fiz um antiético estudo dos
professores do Karolinska Institutet,
00:04:20
que escolhe o Prêmio Nobel de medicina,
e eles se saíram iguais aos chimpanzés ali.
00:04:28
Hoje existe mais informação
acessível do que em qualquer outra época.
00:04:32
E eu trabalho com o meu time na
Fundação Gapminder
00:04:35
usando novas ferramentas que ajudarão
a todos a entender o mundo mutante.
00:04:41
Pegamos as enormes quantidades de dados
agora disponíveis gratuitamente
00:04:45
de institutos internacionais
como a ONU e o Banco Mundial.
00:04:49
E a minha missão se tornou
compartilhar a compreensão
00:04:53
desses dados com todos
que quiserem ouvir,
00:04:56
e para revelar como as estatísticas
não são assustadoras.
00:05:02
Eu vou lhes proporcionar uma visão
00:05:05
da situação da saúde global
em toda a humanidade.
00:05:09
E vou fazer isso, espero,
de uma maneira agradável, então relaxe.
00:05:14
Então nós fizemos esse programa
que mostra dessa forma.
00:05:17
Cada bolha aqui é um país
00:05:19
essa é a China, essa é a Índia.
00:05:21
O tamanho da bolha
é a população.
00:05:23
Eu vou fazer uma corrida entre
esse Ford amarelo aqui
00:05:27
e o Toyota vermelho ali
embaixo e o Volvo marrom.
00:05:32
O Toyota começou muito mal
aqui embaixo, e os Estados Unidos,
00:05:36
Ford está fazendo um off-road ali.
00:05:38
E o Volvo está indo muito bem,
esta é a guerra.
00:05:40
O Toyota está saindo da pista, agora
o Toyota está com a saúde da Suécia.
00:05:43
Isso foi quando eu vendi
o Volvo e comprei o Toyota.
00:05:47
Esse é o Grande Salto Adiante,
quando a China caiu.
00:05:50
Foi o planejamento planificado
do Mao Tsé-Tung.
00:05:53
A China se recuperou e disse,
"Chega dessa porcaria planificada",
00:05:56
mas eles foram lá pra cima.
00:05:57
Não, existe mais uma disparidade,
olhem ali - Estados Unidos.
00:06:02
Eles quebraram meu gráfico. Washington DC
é rica a esse ponto,
00:06:07
mas não tão saudável quanto Kerala,
na Índia. Muito interessante, não?
00:06:20
Bem-vindos aos EUA,
líderes mundiais em carros enormes
00:06:25
e dados grátis.
00:06:28
Existem muitos aqui que
compartilham da minha visão
00:06:32
de dados públicos
acessíveis e úteis para todos.
00:06:35
A cidade de São Francisco está na
liderança, abrindo todo tipo de dados.
00:06:43
Até o departamento de polícia está liberando
todos os seus relatórios de crimes.
00:06:47
Os dados oficiais
de crimes foram transformados
00:06:50
em um lindo mapa interativo
por dois gênios da computação da cidade.
00:06:55
É a estatística de comunidade em ação.
00:07:03
1% de chance de serem vítimas de crimes
violentos aqui este ano.
00:07:09
Crimespotting é um
mapa de relatórios de crime
00:07:11
do Departamento de
Polícia de São Francisco
00:07:13
mostrando pontos em mapas
para os cidadãos enxergarem
00:07:16
padrões de crime em sua vizinhança.
00:07:19
O mapa não é só sobre
crimes indiviuais,
00:07:21
mas sobre padrões maiores
que mostram onde o crime se
00:07:25
concentra na cidade, quais
áreas têm muito crime,
00:07:27
e quais áreas têm
relativamente pouco crime.
00:07:36
Estamos no topo da rua Jones na Nob Hill
00:07:42
uma boa vizinhança.
00:07:45
O que os mapas de crime nos mostra
é a relação entre
00:07:49
topografia e crime.
00:07:51
Basicamente, quanto mais alto na colina,
menos crime.
00:07:56
Você atravessa a fronteira
00:07:58
para as planícies...
00:08:02
Logo que se chega nas partes baixas da
rua Jones, o crime aumenta muitíssimo.
00:08:20
Estamos aqui no
distrito Tenderloin.
00:08:26
Uma das vizinhanças mais antigas e
populosas de São Francisco.
00:08:30
É aqui que se vem para comprar drogas.
00:08:32
Logo ali.
00:08:37
Aqui vemos muitos casos de agressão,
muito roubo de carros.
00:08:41
Uma grande parte do crime da cidade
acontece nesse raio de 5 a 6 quarteirões.
00:08:55
Se você tem ouvido sirenes de polícia
na sua vizinhança,
00:08:58
você pode usar o mapa
para descobrir o porquê.
00:09:02
Se você saiu à noite numa
parte da cidade que não conhece,
00:09:05
pode checar o mapa
para ver quais ruas evitar.
00:09:09
Se um vizinho for assaltado,
você pode ver
00:09:12
foi isolado ou houve
um aumento no crime local?
00:09:15
Se você passa diáriamente por uma
vizinhança e está preocupado
00:09:19
com a sua segurança,
podermos desligar todo
00:09:23
os crimes noturnos e no meio do dia
00:09:25
e mostrar as coisas que
acontecem durante a sua passagem,
00:09:28
é uma operação estatística. Mas eu acho que
as pessoas que estão interagindo com o mapa
00:09:33
se sentem como se estivessem
navegando num site ou comprando na Amazon.
00:09:38
Elas olham pros dados e não se dão
conta que estão fazendo estatísticas.
00:09:43
O que é mais animador para mim
é que as estatísticas públicas
00:09:47
estão tornando os cidadãos mais poderosos e
as autoridades mais responsáveis.
00:09:56
Liberou 163 bancos de dados públicos
para São Francisco.
00:10:02
Nós temos encontros comunitários
que a polícia participa
00:10:04
onde os cidadãos estão
trazendo impressões
00:10:08
dos mapas que mostram onde
os crimes estão acontecendo,
00:10:12
e estão exigindo serviços
do departamento de polícia
00:10:16
e o departamento de polícia está agora
tendo que mudar como eles policiam,
00:10:20
como eles prestam o
serviço de policiamento,
00:10:22
porque os dados estão mostrando
o que funciona e o que não funciona.
00:10:28
O povo de São Francisco
está usando dados públicos
00:10:31
para mapear desigualdades sociais
e ver como melhorar a sociedade.
00:10:35
E as possibilidades são infinitas.
00:10:39
Eu acho que o nosso projeto sonho
de análise de dados governamentais
00:10:43
seria focado em informações em tempo real,
00:10:46
em coisas que vão sendo
relatadas para o mundo
00:10:48
via internet à medida
que vão acontecendo.
00:10:51
Tipo retiradas de lixo,
acidentes de trânsito, ônibus,
00:10:54
e eu acho que com o poder
das estatísticas de dados
00:10:57
da internet, é possível realmente começar a
enxergar como uma cidade funciona,
00:11:02
apresentada numa interface unificada.
00:11:07
É para esse caminho que estamos indo.
00:11:09
Para um mundo onde os dados livres com toda
a análise estatística que pode vir deles,
00:11:14
acessíveis por todos,
dando poder aos cidadãos e
00:11:18
fazendo com que governantes
sejam mais responsáveis.
00:11:21
Isso é muito além
de onde as estatísticas começaram.
00:11:26
As estatísticas são
essenciais para nós monitorarmos
00:11:29
nossos governos e nossas sociedades.
00:11:32
Mas foram nossos governantes que começaram
00:11:36
a coleção de estatísticas, para poderem
nos monitorar melhor!
00:11:46
Na verdade, a palavra "estatística"
vem de "estado".
00:11:51
A estatística moderna
começou dois séculos atrás.
00:11:55
Quando começou,
se espalhou e não parou mais.
00:11:59
E adivinhe quem foram os pioneiros!
00:12:03
Os chineses têm o Confúcio,
os italianos têm o da Vinci,
00:12:07
e os britãnicos têm Shakespeare.
00:12:10
E nós temos a Tabellverket
00:12:12
a primeira coleção sistemática
de estatísticas!
00:12:16
Desde o ano 1749
nós coletamos dados
00:12:21
a cada nascimento, casamento
ou morte, e temos muito orgulho disso!
00:12:29
A Tabellverket gravou informações
00:12:32
de todas as paróquias da Suécia.
00:12:34
Foi uma enorme quantidade de dados, e
foi a primeira vez que qualquer governo
00:12:39
pôde ter uma idéia precisa de seu povo.
00:12:49
A Suécia foi o maior poder militar
do Norte da Europa,
00:12:53
mas em 1749 a nossa estrela
estava se apagando,
00:12:57
outros países estavam ficando mais fortes.
00:13:00
Pelo menos éramos uma grande potência,
00:13:03
tida por ter 20 milhões
de habitantes, o bastante
00:13:06
para fazer frente às
rivais França e Inglaterra.
00:13:13
Mas nós teríamos uma terrível surpresa.
00:13:17
A primeira análise da Tabellverket
00:13:20
revelou que a Suécia tinha
apenas 2 milhões de habitantes.
00:13:24
A Suécia não era somente
um poder em decadência,
00:13:27
mas também tinha uma
população muito pequena.
00:13:30
O governo ficou horrorizado com essa
descoberta - e se o inimigo descobrisse?
00:13:37
Mas a Tabellverket também
mostrou que muitas mulheres
00:13:41
morriam no parto, e que
muitas crianças morriam jovens.
00:13:44
Então o governo entrou em ação
para melhorar a saúde do povo.
00:13:48
Foi o começo da Suécia moderna.
00:13:53
Levou mais 50 anos antes que
austríacos, belgas, dinamarqueses,
00:13:59
holandeses, franceses, alemães, italianos
00:14:02
e, finalmente, os britãnicos, alcançassem
os suecos na coleção e uso de estatísticas.
00:14:15
Professor do Entendimento Público de Risco
(60% do tempo)
00:14:18
Cientista Sênior, Unidade de
Bioestatísticas (40% do tempo)
00:14:24
Foi chamada de aritmérica política.
Uma maneira adorável de se referir às estatísticas.
00:14:29
Os governos podiam ter muito maior
controle e entendimento da
00:14:33
sociedade - como ela
funciona, como progride
00:14:36
e essencialmente eles
podiam controlá-la melhor.
00:14:43
Não foram apenas os governos que
acordaram para o poder das estatísticas.
00:14:47
Na Europa inteira, a sociedade do século 19
estava louca por fatos.
00:14:54
E, apesar de ter
começado tarde, a Inglaterra
00:14:57
com a sua Sociedade Real
de Estatística em Londres,
00:15:01
logo virou o nirvana dos estatísticos.
00:15:05
Eu adoro ver essas copias antigas
do jornal da Sociedade Real de Estatísticas
00:15:09
porque está cheio de coisas esquisitas.
00:15:11
Tem um jornal incrível dos anos 1840
00:15:14
que mostra um mapa da Inglaterra e
as taxas de bastardos em cada região.
00:15:19
Então você pode identificar rapidamente as
áreas com altos índices de bastardismo.
00:15:23
Estando na Ânglia Oriental, sempre
acho divertido que Norfork
00:15:27
parece estar no topo da
"liga dos bastardos" de 1840.
00:15:32
Um dos fundadores da
Sociedade Real de Estatísticas
00:15:36
foi o grande matemático vitoriano
e inventor Charles Babbage.
00:15:42
Em 1842 ele leu o último poema do igualmente
grande vitoriano, Alfred Tennyson.
00:15:50
Visão do Pecado continha as linhas:
00:15:53
"Encha a xicara, encha a lata."
00:15:55
"Tenha um despertar antes do amanhecer."
00:15:58
"A todo momento morre um homem
Todo momento um nasce."
00:16:03
Babbage era tão fixado em estatísticas
que não pôde se conter.
00:16:07
Ele mandou uma carta para Tennyson
00:16:09
explicando que por causa do
crescimento da população,
00:16:12
a linha deveria ser,
00:16:13
"A todo momento morre um homem
e um e 16 avos nasce."
00:16:18
Devo adicionar que
o número exato é 1.067,
00:16:22
mas concessões devem ser feitas
para as leis das letras.
00:16:31
No século 19, estudiosos
na europa fizeram um incrível trabalho
00:16:36
ao medir suas sociedades.
00:16:39
Eles estavam se dedicando a
dados sobre quase tudo.
00:16:42
Mas apenas números não nos dizem nada.
00:16:46
Você deve analisá-los,
e é aí que entra a estatística.
00:16:55
Quanto os primeiros estatísticos
começaram a se familiarizar com
00:16:59
a análise de seus dados
00:17:00
eles adoraram a média, e
tiravam média de tudo.
00:17:11
O bom da média é que
00:17:13
você pode pegar uma massa enorme de dados
e reduzí-la a um único número.
00:17:21
E ainda todos nós sejamos únicos,
nossas vidas coletivas produzem
00:17:26
médias que podem
caracterizar populações inteiras.
00:17:34
Na média, a rainha aponta 70
cavaleiros por ano... mas só 15 damas.
00:17:41
Eu olhei no meu jornal local
e vi o caso de uma aposentada
00:17:45
que pisou acidentalmente no acelerador
00:17:49
e esmagou sua amiga contra uma parede.
00:17:52
Uma coisa horrível, devastadora.
00:17:56
E houve o segundo caso
sobre um jovem que não tinha
00:18:01
carteira de motorista, estava dirigindo
drogado e alcoolizado,
00:18:07
e ele atropelou e matou um pedestre.
00:18:10
O que é notável, absolutamente notável,
se você olhar pro número
00:18:15
de pessoas que morrem todos ano em acidentes
de trânsito, é praticamente constante.
00:18:22
O quê?
00:18:24
Todos esses eventos
individuais, de alguma forma
00:18:28
quando você soma tudo, tá
o mesmo número todo ano.
00:18:31
E todo ano, morrem duas
vezes e meia mais homens
00:18:35
que mulheres morrem em
acidentes, e isso é constante.
00:18:38
E todo ano o número na
Bélgica é o dobro da Inglaterra.
00:18:44
Essas são regularidades notáveis.
00:18:47
Então esses eventos individuais
se somam num fenômeno social.
00:18:56
Vamos ver o que a Suécia fez.
00:18:58
Costumávamos nos vangloriar do rápido
progresso social, nós estávamos lá...
00:19:01
Nas minhas palestras, para contar
histórias sobre o mundo em mudança,
00:19:05
Eu uso médias de países inteiros,
00:19:08
seja a média de renda,
mortalidade infantil, tamanho das famílias
00:19:12
ou emissão de carbono.
00:19:13
OK, temos aqui a Singapura.
No ano em que nasci,
00:19:16
a Singapura tinha o dobro da mortalidade infantil
da Suécia, o país mais tropical do mundo,
00:19:20
um pântano no Equador, e aqui vamos nós.
00:19:22
Levou um tempo para eles
conseguirem a independência,
00:19:25
mas então eles começaram
a crescer sua economia,
00:19:27
e fizeram investimentos
sociais, eliminaram a malária,
00:19:29
eles têm um magnífico sistema de saúde
que bateu os EUA e a Suécia.
00:19:33
Nunca achamos que isso aconteceria,
que eles iriam ganhar da Suécia!
00:19:40
As médias são úteis,
mas não contam a história toda.
00:19:48
Na média, os suecos têm
um pouco menos que duas pernas.
00:19:53
Isso é porque algumas pessoas têm
apenas uma perna, ou nenhuma,
00:19:57
e ninguém tem três pernas.
00:19:59
Então quase todos na Suécia têm
mais do que a média de pernas.
00:20:06
A variação nos dados é tão importante
quanto a média.
00:20:16
Mas como entender a variação?
00:20:19
Para isso, você transforma
os números em formas.
00:20:23
Vamos olhar novamente para o número de
mulheres adultas na Suécia
00:20:26
de diferentes alturas.
00:20:27
Ao plotar os dados como formas,
vemos como as alturas
00:20:32
variam da média e qual o
tamanho dessa variação.
00:20:36
O formato de um grupo de dados é
chamado da sua distribuição.
00:20:41
Essa é a distribuição de
renda da China, em 1970.
00:20:46
Essa é a distribuição de renda
dos Estados Unidos, 1970.
00:20:51
Quase não se encontram,
e então o que aconteceu?
00:20:54
A China está crescendo,
já não é mais tão igualitária,
00:20:56
e aparece aqui ameaçando os Estados Unidos.
00:21:01
Não parece um fantasma?
00:21:03
Assustador.
00:21:17
Os primeiros estatísticos
que exploraram a distribuição
00:21:21
descobriram uma forma
que parecia ser muito comum.
00:21:25
O estudioso vitoriano Francis Galton
00:21:28
estava tão fascinado que construiu uma
máquina que conseguia reproduzir essa forma,
00:21:32
e ele descobriu que ela descrevia tantos
conjuntos de dados diferentes
00:21:36
que ele a chamou de "distribuição normal".
00:21:38
Seja tamanho de braços das pessoas,
capacidade dos pulmões,
00:21:45
ou até seus resultados em provas,
00:21:47
a forma da distribuiçã normal
aparece de novo e de novo.
00:21:51
Outros estatísticos acharam
outras formas regulares,
00:21:56
cada uma produzira por tipos particulares
de processos naturais ou sociais.
00:22:01
E cada estatístico tem a sua favorita.
00:22:05
A distribuição Poisson, a forma Poisson
é a minha forma preferida.
00:22:09
Ela é viciante.
00:22:15
A forma Poisson descreve a chance de
00:22:18
eventos fora do comum acontecerem.
00:22:21
Imagine uma parada de ônibus em Londres,
onde sabemos que em média
00:22:24
passam três ônibus em uma hora.
00:22:26
Não vamos ter sempre três ônibus, é claro.
00:22:29
Incrivelmente, a forma Poisson
nos mostra a probabilidade
00:22:33
de, em qualquer hora, termos
quatro cinco ou seis ônibus,
00:22:37
ou ônibus nenhum.
00:22:40
A forma exata muda com a média.
00:22:43
Mas seja em quantas
pessoas ganham a loteria
00:22:46
a cada semana,
00:22:48
ou quantas pessoas vão ligar para
um call center a cada minuto,
00:22:51
a forma Poisson vai dar as probabilidades.
00:22:57
Um exemplo incrível disso foi
aplicado no fim do século 19,
00:23:01
a contagem anual de oficiais prussianos
00:23:04
de cavalaria que eram pisoteados
até a morte por seus cavalos.
00:23:07
Em alguns anos não havia
nenhum, outros apenas um,
00:23:10
alguns anos haviam dois, até sete,
imagino que tenha sido um ano ruim.
00:23:13
Mas com essa distribuição,
indepentende dos anos em que haviam
00:23:16
nenhum, um, dois, três, quatro
oficiais de cavalaria prussianos
00:23:19
mortos por seus cavalos, obedecia
lindamente a distribuição Poisson.
00:23:42
Então os estatísticos usam formas
para revelar os padrões nos dados.
00:23:48
Mas também usamos imagens de todos os tipos
00:23:51
para comunicar estatísticas
ao público em geral.
00:23:54
Porque se a história nos números
00:23:57
é contada de uma maneira bonita
e inteligente, então todos entendem.
00:24:02
Dos pioneiros dos gráficos estatísticos,
a minha favorita é a Florence Nightingale.
00:24:17
Um dos 20.389 livros na Biblioteca
Britãnica com 'estatística' no título.
00:24:24
Poucas pessoas sabem que ela era conhecida
00:24:27
como uma estatística apaixonada,
e não apenas como a Dama da Lâmpada.
00:24:30
Ela disse que "para endender o pensamento
de Deus, deve-se estudar estatística,
00:24:34
"pois ela é a medida de Seu propósito".
00:24:37
As estatisticas para ela eram um
dever religioso, e imperativo moral.
00:24:42
Quanto Florence tinha nove anos quando
começou a coletar dados.
00:24:45
Seus dados eram diferentes
frutas e vegetais que ela achava.
00:24:48
Os colocava em tabelas diferentes.
00:24:50
Tentando organizá-los de uma forma padrão.
00:24:52
Temos aqui uma das primeiras tabelas
estatística de Nightingale
00:24:55
aos nove anos de idade.
00:25:04
Em meados dos anos
1850, Florence Nightingale foi
00:25:07
para a Criméia tratar das
baixas de guerra britânicas.
00:25:11
Ela ficou horrorizada pelo que descobriu.
00:25:14
Por todo soldado caído em combate,
haviam muitos, muitos mais
00:25:19
morrendo por doenças que pegavam
nos imundos hospitais do exército.
00:25:25
Então Florence Nightingale
começou a contar os mortos.
00:25:29
Por dois anos ela registrou dados
de mortalidade de maneira meticulosa.
00:25:34
Quando a guerra acabou ela persuadiu
o governo a implantar a.
00:25:39
Comissão Real de Inquérito,
00:25:41
e apresentou seus dados
em um relatório devastador.
00:25:44
O que garantiu seu lugar nos
livros de história estatística
00:25:48
são os gráficos que ela usou.
00:25:50
E um em particupar,
o gráfico de área polar.
00:25:53
Para cada mês da guerra, a enorme
parcela azul representava
00:25:58
os soldados mortos por doenças preveníveis.
00:26:01
A muito menor parcela azul eram
mortes por ferimentos,
00:26:05
e as parcelas pretas eram mortes
por acidentes e outras causas.
00:26:11
Os gráficos da Nightingale eram tão claros
que foram impossíveis de ignorar.
00:26:17
O comum na época de Nightingale
00:26:19
era produzir tabelas e tabelas com números.
Uma coisa absolutamente tediosa que,
00:26:23
a menos que você fosse um estatístico
absolutamente dedicado,
00:26:26
era muito difícil de visualizar
padrões naturamente.
00:26:29
Mas as visualizações contam uma história,
e a contam imediatamente.
00:26:33
E o uso de cor e forma podem realmente
contar uma história poderosa.
00:26:38
E hoje em dia, naturalmente, podemos
também fazer as coisas se moverem.
00:26:41
Florence Nightingale teria adorado
poder brincar com isso...
00:26:44
Ela teria produzido animações incríveis,
tenho certeza disso.
00:26:50
Hoje, 150 anos depois,
os gráficos de Nightingale
00:26:54
são considerados um clássico.
00:26:57
Eles levaram a uma revolução
em enfermagem, tratamento
00:27:00
e higiene em hospitais no mundo todo,
salvando incontáveis vidas.
00:27:07
E os gráficos estatísticos se
tornaram uma forma de arte própria,
00:27:11
liderados por designers apaixonados
por visualização de dados.
00:27:19
Tem uma chace de 1 em 207 de morrer
devido a um erro médico.
00:27:24
Esse é o Bilhão de Librômetro.
00:27:26
Essa imagem surgiu da frustração
00:27:29
com as notícias dos
bilhões de libras na mídia.
00:27:32
£500 bilhões pra essa guerra.
00:27:34
£50 bilhões pra um derramamento de óleo.
00:27:36
Não faz sentido - os números são grandes
demais para a nossa mente compreender.
00:27:39
Então em peguei todos esses dados de inúmeras
fontes de notícias e criei esse diagrama.
00:27:43
Os quadrados aqui estão em escala de acordo
com as quantias de bilhões de libras.
00:27:48
Quando você vê os
números visualizados assim,
00:27:51
começa a ter um
relacionamento diferente com eles.
00:27:54
Você começa a ver os
padrões e escalas deles.
00:27:57
Aqui no canto, esse
quadradinho - £37 bilhões.
00:27:59
Esse foi o custo previsto para a
guerra do Iraque em 2003.
00:28:02
Como você pode ver, ele cresceu
exponencialmente nos últimos anos.
00:28:06
E o custo total está hoje
em torno de £2.500 Bilhões.
00:28:10
É engraçado porque quando você
visualiza as estatísticas
00:28:13
você as entende, e
quando você as entende,
00:28:15
você pode de fato começar a
colocar as coisas em perspectiva.
00:28:23
A visualização está bem no centro
do meu trabalho também.
00:28:27
Eu ensino saúde global.
00:28:30
E eu sei que ter os dados não basta.
00:28:33
Eu preciso mostrá-los de maneiras que
as pessoas gostem e entendam.
00:28:39
Agora eu vou tentar
algo que nunca fiz antes.
00:28:42
Animação dos dados no espaço real,
00:28:45
com um pouco de ajuda técnica da equipe.
00:28:50
Vamos lá.
00:28:52
Primeiro, um eixo para saúde.
00:28:54
Expectativa de vida
de 25 a 75 anos.
00:28:58
E aqui embaixo um eixo para riqueza.
00:29:01
Renda por pessoa -
400, 4,000, 40,000.
00:29:06
Então aqui embaixo temos pobres e doentes.
00:29:10
Aqui em cima estão ricos e saudáveis.
00:29:14
Agora vou mostrar o mundo
00:29:18
200 anos atrás, em 1810.
00:29:21
Aqui estão todos os países.
00:29:22
Europa, marrom;
Asia, vermelho; Oriente Médio, verde;
00:29:26
África ao Sul do Saara,
azul; E as Américas, amarelo.
00:29:29
E o tamanho da bolha do país
mostra o tamanho da população.
00:29:33
Em 1810 estava bastante
cheio aqui embaixo, não é?
00:29:37
Todos os países eram pobres e doentes.
00:29:39
A Expectativa de vida era
abaixo de 40 em todos os países.
00:29:43
Apenas Reino Unido e Holanda estavam
um pouco melhores. Mas não muito.
00:29:48
E agora vou avançar o mundo.
00:29:52
A revolução industrial faz com que
países na Europa e outros lugares
00:29:56
se distanciem dos demais.
00:29:59
Mas os países colonizados na Asia e África
00:30:02
continuam presos lá embaixo.
00:30:04
E eventualmente os países ocidentais
vai ficando cada vez mais saudáveis.
00:30:08
E agora vamos diminuir para mostrar
o impacto da Primeira Guerra Mundial
00:30:13
e da epidemia da Gripe Espanhola.
00:30:15
Que catástrofe!
00:30:18
E agora aceleramos
pelos anos 1920 e 1930 e,
00:30:22
apesar da Grande Depressão,
00:30:24
países ocidentais continuam a ir
para maior riquesa e saúde.
00:30:27
Japão e outros tentam seguir.
00:30:30
Mas a maioria deles fica aqui embaixo.
00:30:32
E depois das tragédias da
Segunda Guerra Mundial,
00:30:35
paramos um pouco para olhar o
mundo em 1948.
00:30:39
1948 foi um ótimo ano.
00:30:42
A guerra tinha acabado,
00:30:43
A Suécia ficou no topo do quadro de medalhas
das Olimpíadas de Inverno e eu nasci.
00:30:48
Mas as diferenças entre
os países do mundo
00:30:51
estava maior que nunca.
00:30:52
Os Estados Unidos estavam na frente.
00:30:54
O Japão estava melhorando.
00:30:56
O Brasil estava bem atrás,
00:30:58
O Irã estava ficando um pouco mais rico com
o petróleo mas ainda tinha vidas curtas.
00:31:03
E os gigantes asiáticos
00:31:05
China, Índia, Paquistão, Bangladesh
e Indonésia,
00:31:08
ainda estavam pobres e doentes lá embaixo.
00:31:11
Mas olhe o que está prestes a acontecer!
Lá vamos nós de novo.
00:31:14
Durante a minha vida, antigas colônias
ganharam independência e então finalmente
00:31:18
começaram a ficar mais e mais
saudáveis, e mais e mais ricas.
00:31:22
E nos anos 1970, países
na Ásia e América Latina
00:31:26
começaram a se aproximar dos países ricos.
00:31:28
Eles se tornaram as economias emergentes.
00:31:31
Alguns na África avançaram,
00:31:32
outros africanos ficaram presos por guerras
civis, outros afetados pelo HIV.
00:31:37
E agora vemos o mundo com
as estatísticas mais atualizadas.
00:31:42
A maior parte das
pessoas hoje vive no meio.
00:31:45
Mas já uma imensa diferença
00:31:48
entre os melhores e piores países.
00:31:51
Também existem enormes
desigualdades dentro dos países.
00:31:55
As bolhas mostram as médias dos países,
mas eu posso dividí-las.
00:31:59
Pegue a China. Eu posso
dividí-la entre províncias.
00:32:02
Lá vai Xangai...
00:32:05
Ela tem a mesma riquesa
e saúde da Itália hoje.
00:32:08
E lá vai a pobre província
interiorana de Guizhou,
00:32:11
ela é como o Paquistão.
00:32:12
E se eu dividir mais ainda, as
partes rurais são como Gana na África.
00:32:19
Ainda assim, apesar das
enormes disparidades atuais,
00:32:23
nós tivemos 200 anos de progresso incrível!
00:32:27
A enorme diferença histórica entre
ocidente e o resto está diminuindo.
00:32:31
Nós nos tornamos um mundo
totalmente novo, convergente.
00:32:35
E eu vejo um claro padrão par ao futuro.
00:32:38
Com assistência, comércio,
tecnologias verdes e paz,
00:32:41
é plenamente possível
que todos possam chegar
00:32:43
ao canto rico e saudável.
00:32:48
Bom, o que vocês viram nos ultimos minutos
00:32:51
é uma história de 200 países mostrada
em 200 anos e além.
00:32:56
Envolveu a plotagem de 120.000 números.
00:33:00
Bacana, né?
00:33:07
Então, com as estatísticas, podemos começar
a ver as coisas como elas realmente são.
00:33:13
De tabelas com dados a médias,
distribuições e visualizações,
00:33:18
as estatísticas nos deram uma
visão clara do mundo.
00:33:22
Mas, com estatísticas, podemos não somente
descobrir O QUE está acontecendo
00:33:28
mas também explorar PORQUE
00:33:30
ao usar um método analítico
poderoso - correlação.
00:33:35
Olhar pra apenas uma coisa
de cada vez não nos diz muita coisa.
00:33:38
Temos que olhar para o
relacionamento entre as coisas,
00:33:41
como elas mudam,
como elas variam juntas.
00:33:43
É assim que age a correlação.
00:33:45
É assim que começamos a
tentar entender os processos
00:33:48
que realmente acontecem
no mundo e na sociedade.
00:33:52
A maioria hoje reconhece que
crime se correlaciona com pobreza,
00:33:57
que infecção se correlaciona
com saneamento ruim,
00:33:59
e que conhecimento de
estatística se correlaciona
00:34:02
com ser bom de dança!
00:34:06
As correlações podem ser complicadas.
00:34:10
Eu recebi uma piada sobre
correlações bobas.
00:34:12
Um americano tinha
medo de ataque do coração.
00:34:15
Ele descobriu que os japoneses
comem pouquíssima gordura
00:34:19
e quase não bebem vinho,
00:34:22
mas tinham muito menos ataques
cardíacos que os americanos.
00:34:25
Mas, por outro lado, ele
também descobriu que os franceses
00:34:28
comem tanta gordura quanto
os americanos, e bebem
00:34:31
muito mais vinho, mas têm
menos ataques cardíacos.
00:34:35
Então ele concluiu que
o que mata é falar inglês.
00:34:40
Fume, fume fume esse cigarro,
00:34:43
Trague, trague, trague, e se
você fumar até a morte...
00:34:48
O tempo, o ritmo,
o cigarro. Weights Tilt.
00:34:51
O melhor exemplo de uma
correlação inovadora
00:34:56
é a ligação que foi estabelecida nos
anos 1950 entre o fumo e câncer de pulmão.
00:35:01
Pouco após o fim da Segunda Guerra Mundial,
um médico britânico, Richard Doll,
00:35:07
invetigou pacientes de câncer de
pulmão em 20 hospitais de Londres.
00:35:11
E ele ficou convencido que a única
coisa que eles tinham em comum era o fumo.
00:35:15
Teve tanta certeza que parou de fumar.
00:35:18
Mas outras pessoas
não tinham tanta certeza.
00:35:22
Grande parte da discussão
sobre os dados iniciais
00:35:25
ligando fumo com câncer, dizia
"Certamente não é o fumo,"
00:35:29
"isso que fizemos a vida toda,
isso não deve fazer mal."
00:35:32
"Talvez sejam os genes."
00:35:35
"Talvez pessoas que são pré-dispostas
geneticamente para ter câncer de pulmão"
00:35:39
"também são pré-dispostas
geneticamente a fumar."
00:35:43
"Talvez não seja o cigarro,
e sim a poluição do ar"
00:35:47
"fumantes de alguma forma são mais expostos
a poluição do ar que os não fumantes."
00:35:52
"Talvez não seja o cigarro,
e sim a pobreza."
00:35:56
Então agora temos três explicações
alternativas, além do simples azar.
00:36:02
Para verificar que a sua correlação
implicava causa e efeito,
00:36:06
Richard Doll criou o maior estudo
estatístico sobre o fumo até então.
00:36:10
Ele começou a seguir a vida
de 40.000 médicos britânicos,
00:36:14
alguns dos quais fumavam e outros não,
00:36:17
e juntou dados suficientes
00:36:19
para correlacionar a quantidade
de médicos que fumavam
00:36:22
com suas possibilidades de pegar câncer.
00:36:24
Eventualmente, ele mostrou não só uma
correlação entre o fumo e o câncer de pulmão,
00:36:30
mas também uma correlação entre
parar de fumar e a redução do risco.
00:36:35
Isso era a ciência em seu melhor.
00:36:39
O que as correlações não substituem
é o pensamento humano.
00:36:44
Você tem que pensar sobre
o que aquilo significa.
00:36:46
O que um bom cientista faz,
se ele chega a uma correlação,
00:36:51
é tentar refutá-la o quanto for possível,
00:36:55
tentar desconstruí-la, se livrar dela,
tentar contestá-la.
00:37:00
Se ela aguentar
todos esses esforços para destruí-la
00:37:05
e ainda estiver de pé, então, cautelosamente,
você diz: "Podemos mesmo ter algo aqui".
00:37:26
Por mais brilhante que seja o cientista,
os dados ainda são o oxigênio da ciência.
00:37:32
A boa notícia é que com
mais dados, vamos achar
00:37:36
mais correlações,
testaremos mais teorias,
00:37:39
e mais descobertas serão possíveis.
00:37:46
E a história mostra
como nossa soma total de
00:37:49
informação salta ao
desenvolvermos novas tecnologias.
00:37:53
A invenção da prensa móvel iniciou a
primeira explosão de dados e informações.
00:38:00
Se você empilhar todos os livros que foram
impressos até o ano 1700,
00:38:06
teríamos 60 pilhas, cada uma com a
altura do Monte Evetest.
00:38:12
Então, começando no século 19,
00:38:15
veio a segunda revolução
da informação com o telégrafo,
00:38:19
gramofone e câmera.
E depois, rádio e TV.
00:38:23
A quantia total de informações explodiu.
00:38:28
E nos anos 1950 a informação disponível a
todos nós tinha se multiplicado 6000 vezes.
00:38:35
Então, graças ao computador e
mais tarde à internet, ficamos digitais.
00:38:41
E a quantia de dados que temos
agora é inimaginavelmente vasta.
00:38:49
Uma única letra impressa em um livro
é equivalente a um byte de dados.
00:38:55
Uma página impressa
equivale a um ou dois kilobytes.
00:39:01
Cinco megabytes são suficientes
para toda a obra de Shakespeare.
00:39:08
10 gigabytes - isso é um filme em DVD.
00:39:16
Dois terabytes são as dezenas de milhões
de fotos adicionadas ao Facebook todo dia.
00:39:24
Dez petabytes é a quantia
de dados gerada a cada
00:39:28
segundo pelo maior acelerador
de partículas do mundo.
00:39:32
É tanto que só uma
pequena fração é gravada.
00:39:35
Seis exabytes é o que você teria se sequenciasse
os genomas de todas as pessoas do planeta.
00:39:48
Mas na verdade, isso não é nada.
00:39:50
Em 2009, a internet
somava até 500 exabytes.
00:39:55
Em 2010, em apenas um ano, isso
vai dobrar pra mais de um zetabyte!
00:40:06
De volta ao mundo real,
se transformássemos todos
00:40:09
esses dados em livros,
isso daria 90 pilhas de livros,
00:40:14
cada uma indo daqui até o Sol!
00:40:18
O dilúvo de dados é desconcertante,
mas com os computadores atuais,
00:40:23
e com a estatística, tenho
confiança de que podemos lidar com isso.
00:40:27
Na questão dos dados de toda a internet,
00:40:31
a potência de análise estatística
00:40:34
é o gigante do Vale do Silício, Google.
00:40:40
São feitas 1 bilhão de
buscas no Google todo dia.
00:40:44
Uma pessoa comum em
sua vida toda é exposta a mais
00:40:47
ou menos 100 milhões
de palavras em conversas.
00:40:50
E se você multiplicar isso pelas 6 bilhões
de pessoas no planeta,
00:40:54
essa quantia de palavras é parecida
com o número de palavras
00:40:58
que a Google tem disponível
a qualquer momento.
00:41:03
Os computadores da Google
rastreiam e arquivam cada
00:41:06
palavra, página e imagem
que conseguem encontrar.
00:41:08
Então eles caçam por padrões
e correlações nesses dados,
00:41:14
fazendo estatística em
uma escala gigantesca.
00:41:17
E, pra mim, eles têm um
projeto que é particularmente
00:41:21
animador - tradução
linguística estatística.
00:41:25
Queríamos garantir acesso a todas as informações
na web, independente da língua falada.
00:41:30
Existe tanta informação na internet,
00:41:33
que seria completamente
impossível traduzir
00:41:35
tudo manualmente em
todas as línguas possíveis.
00:41:37
Decidimos que teríamos que conseguir
fazer tradução automática.
00:41:44
No passado, os programadores
tentavam ensinar seus computadores
00:41:47
a ver cada língua como um
grupo de regras gramáticas.
00:41:50
Da mesma forma que línguas
são ensinadas nas escola.
00:41:53
Mas isso não funcionou porque nenhum conjunto
de regras consegue encapsular uma língua,
00:41:58
com todas suas sutilezas e ambiguidades.
00:42:01
"Tendo comido nosso
almoço, o ônibus partiu".
00:42:05
Bom, isso está obviamente incorreto.
00:42:07
Escrito assim, faz acreditar
que o ônibus comeu o almoço.
00:42:12
Seria muito melhor dizer
00:42:15
"tendo comido nosso almoço,
nós partimos no ônibus".
00:42:19
Essas regras são úteis e ajudam na maioria
das vezes, mas nem sempre são verdade.
00:42:26
E a idéia de usar tradução
estatística automática é dizer,
00:42:30
"Se você tem todas essas exceções, talvez
dê pra trabalhar sem usar regra alguma.
00:42:35
"Talvez você possa tratar tudo como
excessão." E é exatamente isso que fizemos.
00:42:44
Fala 3 de uma estimativa
de 7.358 línguas existentes.
00:42:48
O que o computador está fazendo
quando está aprendendo a traduzir
00:42:52
é aprender as correlações entre palavras
00:42:55
e correlações entre frases.
00:42:57
Então nós alimentamos o sistema com
enormes quantias de dados
00:43:00
e então o sistema vê que uma
determinada palavra ou frase
00:43:04
se correlaciona com
frequência a outra língua.
00:43:09
O site da Google oferece atualmente
tradução entre 57 línguas diferentes.
00:43:15
E faz isso de forma
puramente estatística, tendo
00:43:18
correlacionado uma enorme
coleção de textos multilíngues.
00:43:22
As pessoas que construíram o sistema
não precisaram aprender chinês
00:43:25
para construir o sistema de chinês-para-inglês,
assim como não precisaram saber árabe.
00:43:29
O conhecimento necessário
é basicamente conhecimento de estatística,
00:43:33
conhecimento de ciência da computação
e conhecimento de infraestrutura
00:43:35
para construir os enormes sistemas computacionais
que estamos construindo para fazer isso.
00:43:42
Eu me conectei com a
Google do meu escritório em
00:43:45
Estocolmo para tentar o
tradutor por conta própria.
00:43:48
'Eu vou digitar algumas
sentenças em sueco.'
00:43:51
OK.
00:44:00
OK. Ele está dizendo, "O
ministro de finanças da Suécia
00:44:04
tem um rabo de cavalo e um
brinco de ouro na sua orelha."
00:44:07
Imagino que signifique na orelha dele.
'Correto, isso é incrível!'
00:44:11
'Ele vem do partido Conservador,
esse é o tipo de Suécia que temos hoje'
00:44:15
'Vou digitar mais uma sentença.'
00:44:28
"Em seu relacionamento de
mesmo sexo tem o novo bispo
00:44:31
de Estocolmo e seus
parceiros um filho de três anos."
00:44:35
Está quase perfeito,
tem uma coisa importante
00:44:38
é DELA, é um relacionamento lésbico.
00:44:41
Ok, então esses tipos de palavras,
dele ou dela são um dos desafios
00:44:46
na tradução pra acertar realmente.
00:44:49
Especialmente quando estamos falando
de bispas, temos que dar um desconto!
00:44:51
'Certo, certo.'
00:44:53
Eu acho que é uma palavra
que é entendida com mais
00:44:55
frequência como "ele". 'Vou
escrever mais uma sentença.'
00:45:06
OK. "Quando a Suécia
participa das Olimpídas,
00:45:09
o objetivo não é vencer,
mas vencer a Noruega."
00:45:11
'Sim! É isso que diz!'
00:45:13
'Mas eles são muito bons
nas Olimpíadas de Inverno,
00:45:15
então não conseguimos,
mas estamos tentando.'
00:45:17
Ah, muito bom, muito bom.
00:45:19
'Isso é incrível, e fiquei
especialmente impressionado'
00:45:24
'que ele tenha reconhecido
palavras como "relacionamento
00:45:28
de mesmo sexo", que
são muito novas na língua.'
00:45:30
'O tradutor é bom, mas se eles conseguirem
fazer o que vem a seguir, vai ser fantástico.'
00:45:36
Uma das possibilidades animadoras
00:45:38
é a combinação de tradução automática com
a tecnologia de reconhecimento de fala.
00:45:42
Ambas são de natureza estatística.
00:45:45
A tradução automática depende de estatísticas
para mapear uma linguagem à outra,
00:45:51
e o reconhecimento de
fala depende das estatísticas
00:45:54
para mapear da forma
sonora para palavras.
00:45:57
Quanto as colocamos juntas,
00:45:59
então temos a capacidade
de ter conversas instantâneas
00:46:03
entre duas pessoas que não
falam uma língua em comum.
00:46:06
Eu posso falar com você na minha língua,
00:46:08
você me escuta na sua
língua e me responde de volta.
00:46:11
E em tempo real podemos
fazer essa tradução,
00:46:15
podemos reunir duas pessoas e
permitir que elas conversem.
00:46:31
A internet é só uma
dessas muitas tecnologias
00:46:34
criadas para coletar
quantidades imensas de dados.
00:46:39
Cientistas estudando a Terra
e o nosso meio ambiente
00:46:43
hoje usam uma gama incrível de instrumentos
00:46:47
para medir os processos do nosso planeta.
00:46:52
À nossa volta, sensores
medem continuamente
00:46:55
temperatura, fluxo das
águas e correntes oceânicas.
00:46:59
E em órbita, estão satélites
ocupados em fotografar
00:47:03
formações de nuvens,
crescimento de florestas e geleiras.
00:47:06
Os cientistas falam em
"instrumentalizar a Terra".
00:47:13
E apontando para os céus estão novos e
poderosos telescópios, mapeando o universo.
00:47:30
O que está acontecendo na astronomia
é típico de como essa torrente de dados
00:47:34
está transformando a ciência.
00:47:39
Astrônomos estão agora respondendo
mistérios persistentes do cosmos
00:47:45
ao aplicarem métodos estatísticos
a esses novos dados.
00:47:54
Vive em uma galáxia com mais
de 200.000.000.000 de estrelas.
00:47:59
A galáxia é um lugar muito grande e
contém bilhões de estrelas,
00:48:03
então para juntar um
quadro coerente da galáxia
00:48:06
inteira demanda uma
quantia enorme de dados.
00:48:09
E antes que pudéssemos fazer uma pesquisa
dos céus com sensores digitais,
00:48:13
o que significa mapear muitas,
muitas estrelas de uma vez,
00:48:16
era muito difícil coletar dados
suficientes sobre a galáxia.
00:48:24
No passado, grandes pesquisas do
céu noturno tinham que ser feitas
00:48:28
com a esposição de milhares de
enormes placas fotográficas.
00:48:32
Mas essas pesquisas podiam
demorar 25 anos ou mais.
00:48:39
Então, nos anos 1990, veio a astronomia
digital, e um enorme aumento
00:48:44
tanto da quantidade, quanto da
acessibilidade dos dados.
00:48:49
A Sloan Sky Survey é
a maior pesquisa desse
00:48:52
tipo até hoje, usando
um imenso sensor digital
00:48:55
montado em um telescópio no Novo México.
00:49:00
Ele escaneou o céu noturno todas as
noites por oito anos,
00:49:05
criando uma imagem composta
com resolução sem precedentes.
00:49:09
A Sloan é uma das melhores e mais profundas
pesquisas de dados que temos na astronomia.
00:49:14
Tanto da nossa galáxia, quanto de
outras mais distantes de nós.
00:49:24
Todos os dados da Sloan
estão na internet,
00:49:27
e com eles, os astrônomos
identificaram milhões
00:49:30
de estrelas e galáxias
até então desconhecidas.
00:49:34
Eles também varrem a base de dados
por padrões estatísticos
00:49:37
que irão provar, refutar, ou até
sugerir novas teorias.
00:49:42
Temos uma idéia de como
as galáxias crescem, como elas
00:49:45
se tornam enormes como a
em que vivemos, a Via Láctea,
00:49:49
não é de uma só vez, ou ordenadamente,
mas ao incorporar continuamente,
00:49:55
basicamente canibalizando galáxias menores.
00:49:59
Elas as dissolvem e se tornam parte
da galáxia maior, que vai crescendo.
00:50:06
É uma idéia incrível, e nos dados da Sloan,
temos evidências disso.
00:50:12
Grupos de estrelas que vieram de
galáxias canibalizadas
00:50:16
se sobressaem nos
dados da Sloan como sendo
00:50:18
estatísticamente
diferentes de outras estrelas,
00:50:21
porque elas se movem
com velocidades diferentes.
00:50:24
Cada pico nesses gráficos de distribuição
00:50:28
significa que a Professora
Rockosi achou um grupo de
00:50:31
estrelas viajando de
maneira diferente das outras.
00:50:35
Esses são os padrões chave
que ela está procurando.
00:50:40
As evidências aumentam
para o fato de que
00:50:42
realmente é dessa forma
que as galáxias crescem,
00:50:44
ou pelo menos, uma das principais formas
de como isso acontece.
00:50:47
E isso é uma parte
importante no entendimento de
00:50:50
como as galáxias nascem,
não só a nossa, mas todas.
00:50:56
Quanto maior a quantidade de dados,
mais descobertas podem ser feitas.
00:51:00
E a tecnologia está
melhorando o tempo todo.
00:51:04
O próximo grande telescópio de pesquisa
começará a funcionar em 2015.
00:51:07
Ele vai deixar a Sloan comendo poeira!
00:51:10
A Sloan demorou oito anos para cobrir
um quarto do céu noturno.
00:51:17
O novo telescópio vai
escanear o céu inteiro,
00:51:21
em resolução maior
ainda, a cada três dias!
00:51:34
As vastas quantidades
de dados que temos hoje
00:51:37
permitem que pesquisadores
de diversas áreas
00:51:41
testem suas teorias em uma
escala que antes era inimaginável.
00:51:46
Mais do que isso, pode um dia mudar
fundamentalmente a forma de se fazer ciência.
00:51:53
Com o poder dos computadores modernos
aplicado a esses dados todos,
00:51:58
as máquinas podem ser capazes
de guiar os pesquisadores.
00:52:07
Cada célula de seu corpo tem 2
metros de DNA (20 bilhões de Km no total)
00:52:14
Estamos em um ponto
profundamente importante,
00:52:17
potencialmente um dos
mais significativos da ciência.
00:52:22
E certamente um dos mais animadores,
00:52:24
onde o potencial de transformar
não só como os cientistas
00:52:28
fazem a ciência, mas até o
que é possível com a ciência.
00:52:32
E o que vai impulsionar essa transformação
00:52:34
de como ela e feita, e o
que é possível fazer com ela
00:52:38
vai ser a computação.
00:52:41
Muitas das dinâmicas do mundo natural, como
a interação das florestas com a atmosfera,
00:52:49
são tão complexas que não
as entendemos de fato.
00:52:53
Mas agora os computadores
estão gerando literalmente
00:52:56
dezenas de milhares
de simulações diferentes
00:52:59
de como esses sistemas
biológicos funcionam.
00:53:03
É como se criasse milhares
de mundos paralelos hipotéticos.
00:53:07
E cada uma dessas simulações
00:53:10
é analisada
estatísticamente para ver se
00:53:14
correspondem com o que
é observado na natureza.
00:53:18
Os computadores agora podem
gerar e testar hipóteses
00:53:21
automaticamente, sem quase
nenhuma interação humana.
00:53:28
Essa nova aplicação
da estatística se tornará
00:53:31
absolutamente vital
para o futuro da ciência.
00:53:35
Está criando um novo paradigma
00:53:39
na ciência, no modo em
que fazemos a ciência.
00:53:42
Que é cada vez mais...
00:53:45
Que poderíamos classificar como...
dirigida por dados, ou centrada em dados
00:53:50
ao invés de centrada em
hipóteses ou experimentos.
00:53:55
Então, são tempos emocionantes
em termos da ciência,
00:53:58
em termos da computação e
em termos da estatística.
00:54:08
Mas se isso soa um pouco abstrato e teórico
para você, que tal uma fronteira final?
00:54:15
Poderia a estatística dar
sentido aos nossos sentimentos?
00:54:21
- Na California - onde mais?
- Um cientista da computação
00:54:25
está vasculhando a
internet para tentar encontrar
00:54:29
os padrões dos nossos
pensamentos e emoções.
00:54:36
Se sente feliz 78% do tempo.
00:54:44
Esse é o movimento da loucura.
00:54:46
O movimento da loucura representa
o mundo visto de longe.
00:54:50
Cada um desses pontos coloridos
é um sentimento individual
00:54:54
expressado por alguém
em um blog ou um tweet.
00:54:58
Quando você clica no ponto ele explode para
revelar o sentimento daquela pessoa.
00:55:04
Isso é o que as pessoas estão dizendo
de como se sentem hoje.
00:55:07
Melhor... segura
00:55:10
uma droga
00:55:12
bem
00:55:14
bonita... especial
00:55:17
triste... sozinho...
00:55:25
Então, a cada minuto, o We Feel Fine
varre os blogs do mundo,
00:55:29
pega todas as sentenças que começam com
"estou" ou "me sinto",
00:55:34
e as coloca num banco de dados.
00:55:35
Coletamos esses sentimentos
e contamos os mais comuns.
00:55:40
Eles são melhor... mal
00:55:43
bom... certo
00:55:45
culpado... doente
00:55:48
igual... uma merda
00:55:51
triste... bem
00:55:54
e assim por diante.
00:55:58
E podemos pegar qualquer
sentimento e analizá-lo.
00:56:01
No momento muitas pessoas estão felizes.
00:56:04
Podemos olhar para
todas as pessoas que estão
00:56:07
felizes e dividí-las em
idade, sexo ou localização.
00:56:10
Como os eles têm perfis
públicos, temos essa
00:56:13
informação, então podemos
fazer perguntas como,
00:56:16
"As mulheres são mais
felizes que os homens" ou,
00:56:19
"A Inglaterra é mais feliz
que os Estados Unidos?"
00:56:30
Descobrimos que, à medida que as pessoas
envelhecem, ficam mais felizes.
00:56:33
E, além disso, vimos que pessoas mais jovens
associam felicidade mais com excitação,
00:56:40
e à medida que as pessoas envelhecem,
associam felicidade mais com tranquilidade.
00:56:51
Também vimos que as
mulheres se sentem amadas
00:56:54
mais que os homens,
mas também mais culpadas.
00:56:57
Enquanto os homens se sentem bem mais que
as mulhares, mas também mais sozinhos.
00:57:06
À medida que as pessoas
vivem mais de suas vidas
00:57:09
online, elas deixam
para trás traços digitais,
00:57:12
e esses traços podem começar a analisar
estatísticamente o que significa ser um humano.
00:57:51
Então, onde isso tudo nos leva?
00:57:54
Geramos quantidades inimagináveis de dados
sobre tudo que pudermos pensar.
00:58:00
Analizamos para revelar os padrões.
00:58:02
E agora, não só os experts,
mas qualquer um de nós
00:58:06
pode entender as histórias
contidas nesses números.
00:58:18
Ao invés de nos perdemos por preconceito,
00:58:21
com as estatísticas às nossas
mãos, nossos olhos podem
00:58:24
se abrir para uma visão
do mundo baseada em fatos.
00:58:28
Então, mais do que nunca, podemos nos
tornar autores do nosso próprio destino.
00:58:33
E isso é bem emocionante, não é?!
00:58:38
Enquanto você assistia esse filme...
00:58:44
Pessoas comeram 7.092 toneladas de bananas.