Documentário da BBC "The Joy of Stats" (O Prazer da Estatística) legendado

00:59:18
https://www.youtube.com/watch?v=YnMPJoPmtzU

概要

TLDRO vídeo discute o papel crucial das estatísticas ao transformar dados soltos em informações significativas. Ele explora a evolução da estatística, desde os primeiros dias de coleta de dados na Suécia até seu uso moderno por meio de tecnologias como a internet e os grandes bancos de dados do Google. Exemplos incluem a análise de distribuições para entender populações, a criação de visualizações de dados para comunicar histórias eficazmente, e o uso de estatísticas em setores como saúde global e astronomia. O vídeo também mostra como cidades como São Francisco usam estatísticas para mapear dados sobre crimes, tornando essas informações mais acessíveis ao público e ajudando na tomada de decisões. O uso crescente de grandes dados, facilitado por avanços tecnológicos como a informática, está levando a novas descobertas e mudando a maneira como a ciência e as políticas públicas são conduzidas. Alcançamos um ponto onde a estatística não é mais apenas um campo acadêmico, mas uma ferramenta poderosa que está remodelando como entendemos e interagimos com o mundo.

収穫

  • 📊 Estatísticas transformam dados em conhecimento.
  • 🌍 Amplia o entendimento sobre o mundo e o universo.
  • 📈 Importância na descoberta científica moderna.
  • 🇸🇪 Suécia pioneira na coleta de dados sistemática.
  • 🌐 Uso crescente de dados na internet e informática.
  • 📉 Visualizações tornam dados compreensíveis e impactantes.
  • 🔍 As correlações podem revelar insights profundos.
  • ✨ Potenciais novos paradigmas na ciência com grandes dados.
  • 🔗 Google usa estatísticas para projetos como traduções automáticas.
  • 💼 Dados públicos ajudam a responsabilizar governos e melhorar sociedades.

タイムライン

  • 00:00:00 - 00:05:00

    No mundo contemporâneo, dados são abundantes, mas por si só são confusos e caóticos. A estatística é a chave para extrair significado desses dados, possibilitando uma compreensão real do mundo e transformando o processo de descoberta científica. Na Suécia, um exemplo peculiar de estatísticas surpreendentes inclui a alta proporção de barcos por pessoa, e atributo similar é observado com McDonalds e reatores nucleares. Em crises, a estatística é vista como desperdício, mas ela é crucia para revelar verdades, como demonstrado em comparações entre habilidades de direção de gêneros.

  • 00:05:00 - 00:10:00

    O uso de dados na saúde global é representado por um programa de visualização onde cada bolha é um país. A educação através da visualização compara o progresso de diferentes nações, como Estados Unidos e China. A saúde na Suécia é mostrada comparativamente em um gráfico, destacando disparidades, como a riqueza de Washington DC em contraste com outras áreas. A abordagem interativa de dados em São Francisco ilustra um movimento para tornar dados de criminalidade acessíveis e compreensíveis ao público, utilizando mapas interativos para visualizar padrões.

  • 00:10:00 - 00:15:00

    Com dados abertos, como em São Francisco, o público começa a pressionar por serviços melhores da polícia ao apresentarem mapas de crimes. Isso incentiva mudanças nos serviços policiais, mostrando o poder dos dados em melhorar a sociedade. A ideia é expandir para dados em tempo real, abrangendo serviços como coleta de lixo ou trânsito, usando a internet. Tradicionalmente, estatísticas eram para monitoramento estatal, mas agora serve para o povo avaliar seu governo, um ato que começou na Suécia com registros populacionais sistemáticos.

  • 00:15:00 - 00:20:00

    No séc. 19, a obsessão europeia por dados deu à luz a sociedades como a Real Sociedade de Estatísticas em Londres. Histórias peculiares como a correção de Babbage ao poeta Tennyson por razões estatísticas ilustram a paixão por números da época. Médias se tornaram uma ferramenta importante para interpretar dados e modelar fenômenos sociais, mas a variação é igualmente crítica. A distribuição normal é uma das formas que, quando identificada, oferece insights sobre conjuntos de dados. A predição baseada em distribuições é aplicada em várias áreas, de acidentes de cavalaria a tendências econômicas.

  • 00:20:00 - 00:25:00

    Visualizar dados, como feito por Florence Nightingale no campo das doenças de guerra, transformou estatísticas em ferramentas poderosas de mudança social. O uso de gráficos ajudou a implementar avanços na saúde pública. Hoje, o campo se expandiu para arte e design em dados, revelando padrões intrigantes e aplicando o poder da visualização para comunicar informações complexas de forma envolvente. Nightingale mostrou pelo uso de gráficos que a grande maioria das mortes na guerra eram devido a doenças evitáveis, um fato que revolucionou práticas de enfermagem e salvou vidas incontáveis.

  • 00:25:00 - 00:30:00

    Com a visualização moderna, como o gráfico de 200 anos mostrando mudanças em países de todo o mundo, a complexidade dos dados é ilustrada de maneira dinâmica, ampliando o entendimento sobre as transformações globais e desigualdades internas. A visualização clarifica o que a média não consegue e faz alusão à convergência global de bem-estar econômico e de saúde. Ela demonstra a importância da análise visual para traçar o progresso de países e regiões, incluindo a possibilidade de visualizar variações dentro de um único país, como diferentes províncias na China.

  • 00:30:00 - 00:35:00

    O progresso da ciência na análise de dados começou com a Associação entre fumo e câncer. Estatísticas são usadas para encontrar correlações significativas, como entre fumo e doenças pulmonares. Nunca um método único é aceito até ter passado por rigorosos testes para descartar outras explicações, como genética ou poluição. As correlações identificadas através de estudos extensivos e comparação de dados entre diferentes grupos populacionais permitiram maior compreensão e avanços na saúde pública e políticas de saúde.

  • 00:35:00 - 00:40:00

    Com avanços tecnológicos, a enxurrada de dados disponível cresceu exponencialmente. Desde a imprensa móvel até computadores modernos, cada etapa da história tecnológica trouxe uma explosão de informação. Atualmente, o volume de dados é vasto e encontra-se acessível, permitindo análises detalhadas sobre diversos aspectos da vida em uma escala sem precedentes. Aplicativos modernos utilizam grandes bases de dados, enquanto a Google exemplifica o uso de dados para tradução automática, mostrando o potencial dos algoritmos para superar barreiras linguísticas.

  • 00:40:00 - 00:45:00

    A revolução digital acelerou o volume de dados disponíveis, ilustrado por comparaçöes como o uso de dados pela Google para tradução automática. O programa desenvolvia traduções sem barreiras linguísticas através de estatísticas, melhorando cada vez mais com a ampliação de dados de origem. A ciência também prossegue descobertas no ambiente com instrumentos de monitoramento digital da Terra, revelando correlacionamentos novos sobre nosso planeta e universo. A astronomia digital abriu novas oportunidades para entender formações estelares, encontrando padrões estatísticos em grandes bases de dados.

  • 00:45:00 - 00:50:00

    Novas tecnologias tornaram possível acumular dados em níveis extraordinários, permitindo que cientistas simulem infinitas realidades para encontrar hipóteses que batem com as observações naturais. O futuro da metodologia científica está na ligação entre acumulação de dados e computação avançada, criando um método orientado a dados para descobrir padrões invisíveis a olho nu. Isso representa um paradigma emergente onde dados não são apenas um registro, mas são também de orientação essencial para explorar o universo.

  • 00:50:00 - 00:59:18

    Na exploração de dados pessoais, iniciativas tentam mapear emoções humanas em larga escala. Ao analisar blogs e redes sociais, pesquisadores podem traçar padrões emocionais globais e identificar oscilações de sentimentos entre diferentes demografias. Como pessoas partilham mais de suas vidas online, suas emoções tornam-se quantificáveis estatisticamente, revelando como emoção se manifesta e varia em populações, oferecendo um novo nível de entendimento sobre a experiência humana. A estatística moderna, portanto, abre não apenas uma janela para eventos passados, mas mapeia a existência em um nível emocional profundo.

もっと見る

マインドマップ

Mind Map

よくある質問

  • Por que as estatísticas são importantes?

    As estatísticas ajudam a dar sentido aos dados, permitindo uma melhor compreensão do mundo.

  • Como as estatísticas transformaram o entendimento global?

    Através da análise de largos volumes de dados, ajudando a identificar padrões e fazer correlações significativas.

  • O que é a distribuição normal?

    É uma forma comum de distribuição de dados que aparece em muitos conjuntos de dados naturais.

  • Por que a Suécia foi pioneira na coleta de estatísticas?

    A Suécia começou a coleta sistemática de dados no ano de 1749, o que ajudou o país a entender melhor sua população e questões de saúde pública.

  • Qual é um exemplo de uso de dados públicos?

    São Francisco utiliza dados sobre crimes públicos para criar mapas interativos, ajudando a comunidade a entender e combater o crime local.

  • O que é a Sloan Sky Survey?

    É uma pesquisa do céu usando um imenso sensor digital para mapear estrelas e galáxias.

  • Como a Google utiliza estatísticas para traduções?

    Através da tradução automática estatística, correlacionando grandes quantias de dados textuais em várias línguas.

  • O que é o projeto 'We Feel Fine'?

    É um projeto que rastreia sentimentos expressos em blogs e tweets, analisando estatísticamente os estados emocionais das pessoas.

ビデオをもっと見る

AIを活用したYouTubeの無料動画要約に即アクセス!
字幕
pt-BR
オートスクロール:
  • 00:00:03
    O mundo em que vivemos está repleto de dados que chovem por todos os lados.
  • 00:00:10
    Sozinhos, esses dados são apenas barulho e confusão.
  • 00:00:14
    Para dar sentido a eles, achar significado,
  • 00:00:18
    precisamos de um ramo poderoso da ciência - estatística.
  • 00:00:22
    Acredite em mim, não tem nada de chato nas estatísticas.
  • 00:00:26
    Especialmente hoje em dia, quando podemos fazer os dados cantarem.
  • 00:00:29
    Com a estatística podemos realmente entender o mundo.
  • 00:00:33
    E tem mais.
  • 00:00:35
    Com a estatística, o dilúvio de dados, como é chamada, está nos levando
  • 00:00:40
    a um maior entendimento da vida na Terra e no universo afora.
  • 00:00:46
    E graças ao incrível poder dos computadores modernos,
  • 00:00:50
    ela pode ser fundamental para transformar o processo de descoberta científica.
  • 00:00:57
    Sem brincadeira, a estatística é agora o assunto mais sexy que existe.
  • 00:01:23
    Você sabia que existem um milhão de barcos na Suécia?
  • 00:01:25
    Isso dá um barco a cada 9 pessoas!
  • 00:01:27
    É o número mais alto de barcos por pessoa da Europa.
  • 00:01:31
    A Suécia também tem o maior número de McDonalds,
  • 00:01:34
    computadores e reatores nucleares por pessoa da Europa.
  • 00:01:41
    Os estatísticos geralmente não gostam de dizer sua profissão numa festa.
  • 00:01:45
    Mas na verdade, os estatísticos não deveriam se envergonhar
  • 00:01:48
    porque todos querem entender o que está acontecendo.
  • 00:01:51
    E a estatística nos dá perspectiva sobre o mundo em que vivemos
  • 00:01:56
    que não poderíamos ter de outro modo.
  • 00:02:00
    As pessoas passam em média 24 anos de suas vidas dormindo.
  • 00:02:04
    As estatísticas nos dizem se as coisas que pensamos e acreditamos são mesmo verdade.
  • 00:02:10
    A maiora dos homens acham que dirigem melhor que as mulheres.
  • 00:02:14
    Mas têm em média o dobro de acidentes fatais por km dirigido.
  • 00:02:20
    E as estatísticas são muito mais úteis do que geralmente gostamos de admitir.
  • 00:02:25
    Na última recessão, houve essa famosa ligação para um talk-show no rádio.
  • 00:02:29
    O homem reclamou, "Em tempos como esses, quando
  • 00:02:33
    o desemprego está em 13%, a renda baixou 5%",
  • 00:02:37
    "e com índices de suicídio subindo, eu fico muito revoltado quando o governo"
  • 00:02:41
    "está desperdiçando dinheiro em coisas como coleta de estatísticas."
  • 00:02:48
    Eu não sou oficialmente um estatístico.
  • 00:02:50
    Sendo rigoroso, o meu campo é saúde global.
  • 00:02:58
    Mas eu me tornei obcecado com estatísticas quando percebi o quanto as pessoas
  • 00:03:03
    na Suécia não conheciam a respeito do resto do mundo.
  • 00:03:06
    Eu comecei na nossa universidade médica, Karolinska Institutet,
  • 00:03:10
    num curso de graduação chamado Saúde Global.
  • 00:03:13
    Esses estudantes vindo até nós tinham as notas mais altas
  • 00:03:17
    no sistema de ensino sueco,
  • 00:03:18
    então eu pensei, "Talvez eles já saibam tudo o que eu tenho para ensiná-los".
  • 00:03:22
    Então eu fiz um pré-teste quando eles chegaram, e uma das questões
  • 00:03:25
    que me ensinaram muito foi a seguinte
  • 00:03:28
    qual país tem a taxa mais alta de mortalidade infantil desses 5 pares?
  • 00:03:32
    Eu não vou testá-los, mas é a Turquia
  • 00:03:34
    que tem o mais alto aqui, Polônia,
  • 00:03:37
    Russia, Paquistão, and África do Sul.
  • 00:03:40
    E esse foi o resultado dos estudantes suecos.
  • 00:03:43
    1.8 respostas certas de 5 possíveis.
  • 00:03:44
    E isso significa que existe lugar para um professor
  • 00:03:47
    de Saúde Internacional e para o meu curso.
  • 00:03:49
    Mas uma noite eu estava compilando o relatório, e fiz a minha descoberta.
  • 00:03:56
    Eu mostrei que os melhores estudantes da Suécia sabem estatisticamente
  • 00:04:00
    menos sobre o mundo que os chimpanzés.
  • 00:04:06
    Porque os chimpanzés acertariam a metade.
  • 00:04:09
    Se eu oferecesse duas bananas escrito Sri Lanka e Turquia,
  • 00:04:12
    eles escolheriam a certa na metade dos casos, mas os estudantes não chegaram lá.
  • 00:04:15
    Eu também fiz um antiético estudo dos professores do Karolinska Institutet,
  • 00:04:20
    que escolhe o Prêmio Nobel de medicina, e eles se saíram iguais aos chimpanzés ali.
  • 00:04:28
    Hoje existe mais informação acessível do que em qualquer outra época.
  • 00:04:32
    E eu trabalho com o meu time na Fundação Gapminder
  • 00:04:35
    usando novas ferramentas que ajudarão a todos a entender o mundo mutante.
  • 00:04:41
    Pegamos as enormes quantidades de dados agora disponíveis gratuitamente
  • 00:04:45
    de institutos internacionais como a ONU e o Banco Mundial.
  • 00:04:49
    E a minha missão se tornou compartilhar a compreensão
  • 00:04:53
    desses dados com todos que quiserem ouvir,
  • 00:04:56
    e para revelar como as estatísticas não são assustadoras.
  • 00:05:02
    Eu vou lhes proporcionar uma visão
  • 00:05:05
    da situação da saúde global em toda a humanidade.
  • 00:05:09
    E vou fazer isso, espero, de uma maneira agradável, então relaxe.
  • 00:05:14
    Então nós fizemos esse programa que mostra dessa forma.
  • 00:05:17
    Cada bolha aqui é um país
  • 00:05:19
    essa é a China, essa é a Índia.
  • 00:05:21
    O tamanho da bolha é a população.
  • 00:05:23
    Eu vou fazer uma corrida entre esse Ford amarelo aqui
  • 00:05:27
    e o Toyota vermelho ali embaixo e o Volvo marrom.
  • 00:05:32
    O Toyota começou muito mal aqui embaixo, e os Estados Unidos,
  • 00:05:36
    Ford está fazendo um off-road ali.
  • 00:05:38
    E o Volvo está indo muito bem, esta é a guerra.
  • 00:05:40
    O Toyota está saindo da pista, agora o Toyota está com a saúde da Suécia.
  • 00:05:43
    Isso foi quando eu vendi o Volvo e comprei o Toyota.
  • 00:05:47
    Esse é o Grande Salto Adiante, quando a China caiu.
  • 00:05:50
    Foi o planejamento planificado do Mao Tsé-Tung.
  • 00:05:53
    A China se recuperou e disse, "Chega dessa porcaria planificada",
  • 00:05:56
    mas eles foram lá pra cima.
  • 00:05:57
    Não, existe mais uma disparidade, olhem ali - Estados Unidos.
  • 00:06:02
    Eles quebraram meu gráfico. Washington DC é rica a esse ponto,
  • 00:06:07
    mas não tão saudável quanto Kerala, na Índia. Muito interessante, não?
  • 00:06:20
    Bem-vindos aos EUA, líderes mundiais em carros enormes
  • 00:06:25
    e dados grátis.
  • 00:06:28
    Existem muitos aqui que compartilham da minha visão
  • 00:06:32
    de dados públicos acessíveis e úteis para todos.
  • 00:06:35
    A cidade de São Francisco está na liderança, abrindo todo tipo de dados.
  • 00:06:43
    Até o departamento de polícia está liberando todos os seus relatórios de crimes.
  • 00:06:47
    Os dados oficiais de crimes foram transformados
  • 00:06:50
    em um lindo mapa interativo por dois gênios da computação da cidade.
  • 00:06:55
    É a estatística de comunidade em ação.
  • 00:07:03
    1% de chance de serem vítimas de crimes violentos aqui este ano.
  • 00:07:09
    Crimespotting é um mapa de relatórios de crime
  • 00:07:11
    do Departamento de Polícia de São Francisco
  • 00:07:13
    mostrando pontos em mapas para os cidadãos enxergarem
  • 00:07:16
    padrões de crime em sua vizinhança.
  • 00:07:19
    O mapa não é só sobre crimes indiviuais,
  • 00:07:21
    mas sobre padrões maiores que mostram onde o crime se
  • 00:07:25
    concentra na cidade, quais áreas têm muito crime,
  • 00:07:27
    e quais áreas têm relativamente pouco crime.
  • 00:07:36
    Estamos no topo da rua Jones na Nob Hill
  • 00:07:42
    uma boa vizinhança.
  • 00:07:45
    O que os mapas de crime nos mostra é a relação entre
  • 00:07:49
    topografia e crime.
  • 00:07:51
    Basicamente, quanto mais alto na colina, menos crime.
  • 00:07:56
    Você atravessa a fronteira
  • 00:07:58
    para as planícies...
  • 00:08:02
    Logo que se chega nas partes baixas da rua Jones, o crime aumenta muitíssimo.
  • 00:08:20
    Estamos aqui no distrito Tenderloin.
  • 00:08:26
    Uma das vizinhanças mais antigas e populosas de São Francisco.
  • 00:08:30
    É aqui que se vem para comprar drogas.
  • 00:08:32
    Logo ali.
  • 00:08:37
    Aqui vemos muitos casos de agressão, muito roubo de carros.
  • 00:08:41
    Uma grande parte do crime da cidade acontece nesse raio de 5 a 6 quarteirões.
  • 00:08:55
    Se você tem ouvido sirenes de polícia na sua vizinhança,
  • 00:08:58
    você pode usar o mapa para descobrir o porquê.
  • 00:09:02
    Se você saiu à noite numa parte da cidade que não conhece,
  • 00:09:05
    pode checar o mapa para ver quais ruas evitar.
  • 00:09:09
    Se um vizinho for assaltado, você pode ver
  • 00:09:12
    foi isolado ou houve um aumento no crime local?
  • 00:09:15
    Se você passa diáriamente por uma vizinhança e está preocupado
  • 00:09:19
    com a sua segurança, podermos desligar todo
  • 00:09:23
    os crimes noturnos e no meio do dia
  • 00:09:25
    e mostrar as coisas que acontecem durante a sua passagem,
  • 00:09:28
    é uma operação estatística. Mas eu acho que as pessoas que estão interagindo com o mapa
  • 00:09:33
    se sentem como se estivessem navegando num site ou comprando na Amazon.
  • 00:09:38
    Elas olham pros dados e não se dão conta que estão fazendo estatísticas.
  • 00:09:43
    O que é mais animador para mim é que as estatísticas públicas
  • 00:09:47
    estão tornando os cidadãos mais poderosos e as autoridades mais responsáveis.
  • 00:09:56
    Liberou 163 bancos de dados públicos para São Francisco.
  • 00:10:02
    Nós temos encontros comunitários que a polícia participa
  • 00:10:04
    onde os cidadãos estão trazendo impressões
  • 00:10:08
    dos mapas que mostram onde os crimes estão acontecendo,
  • 00:10:12
    e estão exigindo serviços do departamento de polícia
  • 00:10:16
    e o departamento de polícia está agora tendo que mudar como eles policiam,
  • 00:10:20
    como eles prestam o serviço de policiamento,
  • 00:10:22
    porque os dados estão mostrando o que funciona e o que não funciona.
  • 00:10:28
    O povo de São Francisco está usando dados públicos
  • 00:10:31
    para mapear desigualdades sociais e ver como melhorar a sociedade.
  • 00:10:35
    E as possibilidades são infinitas.
  • 00:10:39
    Eu acho que o nosso projeto sonho de análise de dados governamentais
  • 00:10:43
    seria focado em informações em tempo real,
  • 00:10:46
    em coisas que vão sendo relatadas para o mundo
  • 00:10:48
    via internet à medida que vão acontecendo.
  • 00:10:51
    Tipo retiradas de lixo, acidentes de trânsito, ônibus,
  • 00:10:54
    e eu acho que com o poder das estatísticas de dados
  • 00:10:57
    da internet, é possível realmente começar a enxergar como uma cidade funciona,
  • 00:11:02
    apresentada numa interface unificada.
  • 00:11:07
    É para esse caminho que estamos indo.
  • 00:11:09
    Para um mundo onde os dados livres com toda a análise estatística que pode vir deles,
  • 00:11:14
    acessíveis por todos, dando poder aos cidadãos e
  • 00:11:18
    fazendo com que governantes sejam mais responsáveis.
  • 00:11:21
    Isso é muito além de onde as estatísticas começaram.
  • 00:11:26
    As estatísticas são essenciais para nós monitorarmos
  • 00:11:29
    nossos governos e nossas sociedades.
  • 00:11:32
    Mas foram nossos governantes que começaram
  • 00:11:36
    a coleção de estatísticas, para poderem nos monitorar melhor!
  • 00:11:46
    Na verdade, a palavra "estatística" vem de "estado".
  • 00:11:51
    A estatística moderna começou dois séculos atrás.
  • 00:11:55
    Quando começou, se espalhou e não parou mais.
  • 00:11:59
    E adivinhe quem foram os pioneiros!
  • 00:12:03
    Os chineses têm o Confúcio, os italianos têm o da Vinci,
  • 00:12:07
    e os britãnicos têm Shakespeare.
  • 00:12:10
    E nós temos a Tabellverket
  • 00:12:12
    a primeira coleção sistemática de estatísticas!
  • 00:12:16
    Desde o ano 1749 nós coletamos dados
  • 00:12:21
    a cada nascimento, casamento ou morte, e temos muito orgulho disso!
  • 00:12:29
    A Tabellverket gravou informações
  • 00:12:32
    de todas as paróquias da Suécia.
  • 00:12:34
    Foi uma enorme quantidade de dados, e foi a primeira vez que qualquer governo
  • 00:12:39
    pôde ter uma idéia precisa de seu povo.
  • 00:12:49
    A Suécia foi o maior poder militar do Norte da Europa,
  • 00:12:53
    mas em 1749 a nossa estrela estava se apagando,
  • 00:12:57
    outros países estavam ficando mais fortes.
  • 00:13:00
    Pelo menos éramos uma grande potência,
  • 00:13:03
    tida por ter 20 milhões de habitantes, o bastante
  • 00:13:06
    para fazer frente às rivais França e Inglaterra.
  • 00:13:13
    Mas nós teríamos uma terrível surpresa.
  • 00:13:17
    A primeira análise da Tabellverket
  • 00:13:20
    revelou que a Suécia tinha apenas 2 milhões de habitantes.
  • 00:13:24
    A Suécia não era somente um poder em decadência,
  • 00:13:27
    mas também tinha uma população muito pequena.
  • 00:13:30
    O governo ficou horrorizado com essa descoberta - e se o inimigo descobrisse?
  • 00:13:37
    Mas a Tabellverket também mostrou que muitas mulheres
  • 00:13:41
    morriam no parto, e que muitas crianças morriam jovens.
  • 00:13:44
    Então o governo entrou em ação para melhorar a saúde do povo.
  • 00:13:48
    Foi o começo da Suécia moderna.
  • 00:13:53
    Levou mais 50 anos antes que austríacos, belgas, dinamarqueses,
  • 00:13:59
    holandeses, franceses, alemães, italianos
  • 00:14:02
    e, finalmente, os britãnicos, alcançassem os suecos na coleção e uso de estatísticas.
  • 00:14:15
    Professor do Entendimento Público de Risco (60% do tempo)
  • 00:14:18
    Cientista Sênior, Unidade de Bioestatísticas (40% do tempo)
  • 00:14:24
    Foi chamada de aritmérica política. Uma maneira adorável de se referir às estatísticas.
  • 00:14:29
    Os governos podiam ter muito maior controle e entendimento da
  • 00:14:33
    sociedade - como ela funciona, como progride
  • 00:14:36
    e essencialmente eles podiam controlá-la melhor.
  • 00:14:43
    Não foram apenas os governos que acordaram para o poder das estatísticas.
  • 00:14:47
    Na Europa inteira, a sociedade do século 19 estava louca por fatos.
  • 00:14:54
    E, apesar de ter começado tarde, a Inglaterra
  • 00:14:57
    com a sua Sociedade Real de Estatística em Londres,
  • 00:15:01
    logo virou o nirvana dos estatísticos.
  • 00:15:05
    Eu adoro ver essas copias antigas do jornal da Sociedade Real de Estatísticas
  • 00:15:09
    porque está cheio de coisas esquisitas.
  • 00:15:11
    Tem um jornal incrível dos anos 1840
  • 00:15:14
    que mostra um mapa da Inglaterra e as taxas de bastardos em cada região.
  • 00:15:19
    Então você pode identificar rapidamente as áreas com altos índices de bastardismo.
  • 00:15:23
    Estando na Ânglia Oriental, sempre acho divertido que Norfork
  • 00:15:27
    parece estar no topo da "liga dos bastardos" de 1840.
  • 00:15:32
    Um dos fundadores da Sociedade Real de Estatísticas
  • 00:15:36
    foi o grande matemático vitoriano e inventor Charles Babbage.
  • 00:15:42
    Em 1842 ele leu o último poema do igualmente grande vitoriano, Alfred Tennyson.
  • 00:15:50
    Visão do Pecado continha as linhas:
  • 00:15:53
    "Encha a xicara, encha a lata."
  • 00:15:55
    "Tenha um despertar antes do amanhecer."
  • 00:15:58
    "A todo momento morre um homem Todo momento um nasce."
  • 00:16:03
    Babbage era tão fixado em estatísticas que não pôde se conter.
  • 00:16:07
    Ele mandou uma carta para Tennyson
  • 00:16:09
    explicando que por causa do crescimento da população,
  • 00:16:12
    a linha deveria ser,
  • 00:16:13
    "A todo momento morre um homem e um e 16 avos nasce."
  • 00:16:18
    Devo adicionar que o número exato é 1.067,
  • 00:16:22
    mas concessões devem ser feitas para as leis das letras.
  • 00:16:31
    No século 19, estudiosos na europa fizeram um incrível trabalho
  • 00:16:36
    ao medir suas sociedades.
  • 00:16:39
    Eles estavam se dedicando a dados sobre quase tudo.
  • 00:16:42
    Mas apenas números não nos dizem nada.
  • 00:16:46
    Você deve analisá-los, e é aí que entra a estatística.
  • 00:16:55
    Quanto os primeiros estatísticos começaram a se familiarizar com
  • 00:16:59
    a análise de seus dados
  • 00:17:00
    eles adoraram a média, e tiravam média de tudo.
  • 00:17:11
    O bom da média é que
  • 00:17:13
    você pode pegar uma massa enorme de dados e reduzí-la a um único número.
  • 00:17:21
    E ainda todos nós sejamos únicos, nossas vidas coletivas produzem
  • 00:17:26
    médias que podem caracterizar populações inteiras.
  • 00:17:34
    Na média, a rainha aponta 70 cavaleiros por ano... mas só 15 damas.
  • 00:17:41
    Eu olhei no meu jornal local e vi o caso de uma aposentada
  • 00:17:45
    que pisou acidentalmente no acelerador
  • 00:17:49
    e esmagou sua amiga contra uma parede.
  • 00:17:52
    Uma coisa horrível, devastadora.
  • 00:17:56
    E houve o segundo caso sobre um jovem que não tinha
  • 00:18:01
    carteira de motorista, estava dirigindo drogado e alcoolizado,
  • 00:18:07
    e ele atropelou e matou um pedestre.
  • 00:18:10
    O que é notável, absolutamente notável, se você olhar pro número
  • 00:18:15
    de pessoas que morrem todos ano em acidentes de trânsito, é praticamente constante.
  • 00:18:22
    O quê?
  • 00:18:24
    Todos esses eventos individuais, de alguma forma
  • 00:18:28
    quando você soma tudo, tá o mesmo número todo ano.
  • 00:18:31
    E todo ano, morrem duas vezes e meia mais homens
  • 00:18:35
    que mulheres morrem em acidentes, e isso é constante.
  • 00:18:38
    E todo ano o número na Bélgica é o dobro da Inglaterra.
  • 00:18:44
    Essas são regularidades notáveis.
  • 00:18:47
    Então esses eventos individuais se somam num fenômeno social.
  • 00:18:56
    Vamos ver o que a Suécia fez.
  • 00:18:58
    Costumávamos nos vangloriar do rápido progresso social, nós estávamos lá...
  • 00:19:01
    Nas minhas palestras, para contar histórias sobre o mundo em mudança,
  • 00:19:05
    Eu uso médias de países inteiros,
  • 00:19:08
    seja a média de renda, mortalidade infantil, tamanho das famílias
  • 00:19:12
    ou emissão de carbono.
  • 00:19:13
    OK, temos aqui a Singapura. No ano em que nasci,
  • 00:19:16
    a Singapura tinha o dobro da mortalidade infantil da Suécia, o país mais tropical do mundo,
  • 00:19:20
    um pântano no Equador, e aqui vamos nós.
  • 00:19:22
    Levou um tempo para eles conseguirem a independência,
  • 00:19:25
    mas então eles começaram a crescer sua economia,
  • 00:19:27
    e fizeram investimentos sociais, eliminaram a malária,
  • 00:19:29
    eles têm um magnífico sistema de saúde que bateu os EUA e a Suécia.
  • 00:19:33
    Nunca achamos que isso aconteceria, que eles iriam ganhar da Suécia!
  • 00:19:40
    As médias são úteis, mas não contam a história toda.
  • 00:19:48
    Na média, os suecos têm um pouco menos que duas pernas.
  • 00:19:53
    Isso é porque algumas pessoas têm apenas uma perna, ou nenhuma,
  • 00:19:57
    e ninguém tem três pernas.
  • 00:19:59
    Então quase todos na Suécia têm mais do que a média de pernas.
  • 00:20:06
    A variação nos dados é tão importante quanto a média.
  • 00:20:16
    Mas como entender a variação?
  • 00:20:19
    Para isso, você transforma os números em formas.
  • 00:20:23
    Vamos olhar novamente para o número de mulheres adultas na Suécia
  • 00:20:26
    de diferentes alturas.
  • 00:20:27
    Ao plotar os dados como formas, vemos como as alturas
  • 00:20:32
    variam da média e qual o tamanho dessa variação.
  • 00:20:36
    O formato de um grupo de dados é chamado da sua distribuição.
  • 00:20:41
    Essa é a distribuição de renda da China, em 1970.
  • 00:20:46
    Essa é a distribuição de renda dos Estados Unidos, 1970.
  • 00:20:51
    Quase não se encontram, e então o que aconteceu?
  • 00:20:54
    A China está crescendo, já não é mais tão igualitária,
  • 00:20:56
    e aparece aqui ameaçando os Estados Unidos.
  • 00:21:01
    Não parece um fantasma?
  • 00:21:03
    Assustador.
  • 00:21:17
    Os primeiros estatísticos que exploraram a distribuição
  • 00:21:21
    descobriram uma forma que parecia ser muito comum.
  • 00:21:25
    O estudioso vitoriano Francis Galton
  • 00:21:28
    estava tão fascinado que construiu uma máquina que conseguia reproduzir essa forma,
  • 00:21:32
    e ele descobriu que ela descrevia tantos conjuntos de dados diferentes
  • 00:21:36
    que ele a chamou de "distribuição normal".
  • 00:21:38
    Seja tamanho de braços das pessoas, capacidade dos pulmões,
  • 00:21:45
    ou até seus resultados em provas,
  • 00:21:47
    a forma da distribuiçã normal aparece de novo e de novo.
  • 00:21:51
    Outros estatísticos acharam outras formas regulares,
  • 00:21:56
    cada uma produzira por tipos particulares de processos naturais ou sociais.
  • 00:22:01
    E cada estatístico tem a sua favorita.
  • 00:22:05
    A distribuição Poisson, a forma Poisson é a minha forma preferida.
  • 00:22:09
    Ela é viciante.
  • 00:22:15
    A forma Poisson descreve a chance de
  • 00:22:18
    eventos fora do comum acontecerem.
  • 00:22:21
    Imagine uma parada de ônibus em Londres, onde sabemos que em média
  • 00:22:24
    passam três ônibus em uma hora.
  • 00:22:26
    Não vamos ter sempre três ônibus, é claro.
  • 00:22:29
    Incrivelmente, a forma Poisson nos mostra a probabilidade
  • 00:22:33
    de, em qualquer hora, termos quatro cinco ou seis ônibus,
  • 00:22:37
    ou ônibus nenhum.
  • 00:22:40
    A forma exata muda com a média.
  • 00:22:43
    Mas seja em quantas pessoas ganham a loteria
  • 00:22:46
    a cada semana,
  • 00:22:48
    ou quantas pessoas vão ligar para um call center a cada minuto,
  • 00:22:51
    a forma Poisson vai dar as probabilidades.
  • 00:22:57
    Um exemplo incrível disso foi aplicado no fim do século 19,
  • 00:23:01
    a contagem anual de oficiais prussianos
  • 00:23:04
    de cavalaria que eram pisoteados até a morte por seus cavalos.
  • 00:23:07
    Em alguns anos não havia nenhum, outros apenas um,
  • 00:23:10
    alguns anos haviam dois, até sete, imagino que tenha sido um ano ruim.
  • 00:23:13
    Mas com essa distribuição, indepentende dos anos em que haviam
  • 00:23:16
    nenhum, um, dois, três, quatro oficiais de cavalaria prussianos
  • 00:23:19
    mortos por seus cavalos, obedecia lindamente a distribuição Poisson.
  • 00:23:42
    Então os estatísticos usam formas para revelar os padrões nos dados.
  • 00:23:48
    Mas também usamos imagens de todos os tipos
  • 00:23:51
    para comunicar estatísticas ao público em geral.
  • 00:23:54
    Porque se a história nos números
  • 00:23:57
    é contada de uma maneira bonita e inteligente, então todos entendem.
  • 00:24:02
    Dos pioneiros dos gráficos estatísticos, a minha favorita é a Florence Nightingale.
  • 00:24:17
    Um dos 20.389 livros na Biblioteca Britãnica com 'estatística' no título.
  • 00:24:24
    Poucas pessoas sabem que ela era conhecida
  • 00:24:27
    como uma estatística apaixonada, e não apenas como a Dama da Lâmpada.
  • 00:24:30
    Ela disse que "para endender o pensamento de Deus, deve-se estudar estatística,
  • 00:24:34
    "pois ela é a medida de Seu propósito".
  • 00:24:37
    As estatisticas para ela eram um dever religioso, e imperativo moral.
  • 00:24:42
    Quanto Florence tinha nove anos quando começou a coletar dados.
  • 00:24:45
    Seus dados eram diferentes frutas e vegetais que ela achava.
  • 00:24:48
    Os colocava em tabelas diferentes.
  • 00:24:50
    Tentando organizá-los de uma forma padrão.
  • 00:24:52
    Temos aqui uma das primeiras tabelas estatística de Nightingale
  • 00:24:55
    aos nove anos de idade.
  • 00:25:04
    Em meados dos anos 1850, Florence Nightingale foi
  • 00:25:07
    para a Criméia tratar das baixas de guerra britânicas.
  • 00:25:11
    Ela ficou horrorizada pelo que descobriu.
  • 00:25:14
    Por todo soldado caído em combate, haviam muitos, muitos mais
  • 00:25:19
    morrendo por doenças que pegavam nos imundos hospitais do exército.
  • 00:25:25
    Então Florence Nightingale começou a contar os mortos.
  • 00:25:29
    Por dois anos ela registrou dados de mortalidade de maneira meticulosa.
  • 00:25:34
    Quando a guerra acabou ela persuadiu o governo a implantar a.
  • 00:25:39
    Comissão Real de Inquérito,
  • 00:25:41
    e apresentou seus dados em um relatório devastador.
  • 00:25:44
    O que garantiu seu lugar nos livros de história estatística
  • 00:25:48
    são os gráficos que ela usou.
  • 00:25:50
    E um em particupar, o gráfico de área polar.
  • 00:25:53
    Para cada mês da guerra, a enorme parcela azul representava
  • 00:25:58
    os soldados mortos por doenças preveníveis.
  • 00:26:01
    A muito menor parcela azul eram mortes por ferimentos,
  • 00:26:05
    e as parcelas pretas eram mortes por acidentes e outras causas.
  • 00:26:11
    Os gráficos da Nightingale eram tão claros que foram impossíveis de ignorar.
  • 00:26:17
    O comum na época de Nightingale
  • 00:26:19
    era produzir tabelas e tabelas com números. Uma coisa absolutamente tediosa que,
  • 00:26:23
    a menos que você fosse um estatístico absolutamente dedicado,
  • 00:26:26
    era muito difícil de visualizar padrões naturamente.
  • 00:26:29
    Mas as visualizações contam uma história, e a contam imediatamente.
  • 00:26:33
    E o uso de cor e forma podem realmente contar uma história poderosa.
  • 00:26:38
    E hoje em dia, naturalmente, podemos também fazer as coisas se moverem.
  • 00:26:41
    Florence Nightingale teria adorado poder brincar com isso...
  • 00:26:44
    Ela teria produzido animações incríveis, tenho certeza disso.
  • 00:26:50
    Hoje, 150 anos depois, os gráficos de Nightingale
  • 00:26:54
    são considerados um clássico.
  • 00:26:57
    Eles levaram a uma revolução em enfermagem, tratamento
  • 00:27:00
    e higiene em hospitais no mundo todo, salvando incontáveis vidas.
  • 00:27:07
    E os gráficos estatísticos se tornaram uma forma de arte própria,
  • 00:27:11
    liderados por designers apaixonados por visualização de dados.
  • 00:27:19
    Tem uma chace de 1 em 207 de morrer devido a um erro médico.
  • 00:27:24
    Esse é o Bilhão de Librômetro.
  • 00:27:26
    Essa imagem surgiu da frustração
  • 00:27:29
    com as notícias dos bilhões de libras na mídia.
  • 00:27:32
    £500 bilhões pra essa guerra.
  • 00:27:34
    £50 bilhões pra um derramamento de óleo.
  • 00:27:36
    Não faz sentido - os números são grandes demais para a nossa mente compreender.
  • 00:27:39
    Então em peguei todos esses dados de inúmeras fontes de notícias e criei esse diagrama.
  • 00:27:43
    Os quadrados aqui estão em escala de acordo com as quantias de bilhões de libras.
  • 00:27:48
    Quando você vê os números visualizados assim,
  • 00:27:51
    começa a ter um relacionamento diferente com eles.
  • 00:27:54
    Você começa a ver os padrões e escalas deles.
  • 00:27:57
    Aqui no canto, esse quadradinho - £37 bilhões.
  • 00:27:59
    Esse foi o custo previsto para a guerra do Iraque em 2003.
  • 00:28:02
    Como você pode ver, ele cresceu exponencialmente nos últimos anos.
  • 00:28:06
    E o custo total está hoje em torno de £2.500 Bilhões.
  • 00:28:10
    É engraçado porque quando você visualiza as estatísticas
  • 00:28:13
    você as entende, e quando você as entende,
  • 00:28:15
    você pode de fato começar a colocar as coisas em perspectiva.
  • 00:28:23
    A visualização está bem no centro do meu trabalho também.
  • 00:28:27
    Eu ensino saúde global.
  • 00:28:30
    E eu sei que ter os dados não basta.
  • 00:28:33
    Eu preciso mostrá-los de maneiras que as pessoas gostem e entendam.
  • 00:28:39
    Agora eu vou tentar algo que nunca fiz antes.
  • 00:28:42
    Animação dos dados no espaço real,
  • 00:28:45
    com um pouco de ajuda técnica da equipe.
  • 00:28:50
    Vamos lá.
  • 00:28:52
    Primeiro, um eixo para saúde.
  • 00:28:54
    Expectativa de vida de 25 a 75 anos.
  • 00:28:58
    E aqui embaixo um eixo para riqueza.
  • 00:29:01
    Renda por pessoa - 400, 4,000, 40,000.
  • 00:29:06
    Então aqui embaixo temos pobres e doentes.
  • 00:29:10
    Aqui em cima estão ricos e saudáveis.
  • 00:29:14
    Agora vou mostrar o mundo
  • 00:29:18
    200 anos atrás, em 1810.
  • 00:29:21
    Aqui estão todos os países.
  • 00:29:22
    Europa, marrom; Asia, vermelho; Oriente Médio, verde;
  • 00:29:26
    África ao Sul do Saara, azul; E as Américas, amarelo.
  • 00:29:29
    E o tamanho da bolha do país mostra o tamanho da população.
  • 00:29:33
    Em 1810 estava bastante cheio aqui embaixo, não é?
  • 00:29:37
    Todos os países eram pobres e doentes.
  • 00:29:39
    A Expectativa de vida era abaixo de 40 em todos os países.
  • 00:29:43
    Apenas Reino Unido e Holanda estavam um pouco melhores. Mas não muito.
  • 00:29:48
    E agora vou avançar o mundo.
  • 00:29:52
    A revolução industrial faz com que países na Europa e outros lugares
  • 00:29:56
    se distanciem dos demais.
  • 00:29:59
    Mas os países colonizados na Asia e África
  • 00:30:02
    continuam presos lá embaixo.
  • 00:30:04
    E eventualmente os países ocidentais vai ficando cada vez mais saudáveis.
  • 00:30:08
    E agora vamos diminuir para mostrar o impacto da Primeira Guerra Mundial
  • 00:30:13
    e da epidemia da Gripe Espanhola.
  • 00:30:15
    Que catástrofe!
  • 00:30:18
    E agora aceleramos pelos anos 1920 e 1930 e,
  • 00:30:22
    apesar da Grande Depressão,
  • 00:30:24
    países ocidentais continuam a ir para maior riquesa e saúde.
  • 00:30:27
    Japão e outros tentam seguir.
  • 00:30:30
    Mas a maioria deles fica aqui embaixo.
  • 00:30:32
    E depois das tragédias da Segunda Guerra Mundial,
  • 00:30:35
    paramos um pouco para olhar o mundo em 1948.
  • 00:30:39
    1948 foi um ótimo ano.
  • 00:30:42
    A guerra tinha acabado,
  • 00:30:43
    A Suécia ficou no topo do quadro de medalhas das Olimpíadas de Inverno e eu nasci.
  • 00:30:48
    Mas as diferenças entre os países do mundo
  • 00:30:51
    estava maior que nunca.
  • 00:30:52
    Os Estados Unidos estavam na frente.
  • 00:30:54
    O Japão estava melhorando.
  • 00:30:56
    O Brasil estava bem atrás,
  • 00:30:58
    O Irã estava ficando um pouco mais rico com o petróleo mas ainda tinha vidas curtas.
  • 00:31:03
    E os gigantes asiáticos
  • 00:31:05
    China, Índia, Paquistão, Bangladesh e Indonésia,
  • 00:31:08
    ainda estavam pobres e doentes lá embaixo.
  • 00:31:11
    Mas olhe o que está prestes a acontecer! Lá vamos nós de novo.
  • 00:31:14
    Durante a minha vida, antigas colônias ganharam independência e então finalmente
  • 00:31:18
    começaram a ficar mais e mais saudáveis, e mais e mais ricas.
  • 00:31:22
    E nos anos 1970, países na Ásia e América Latina
  • 00:31:26
    começaram a se aproximar dos países ricos.
  • 00:31:28
    Eles se tornaram as economias emergentes.
  • 00:31:31
    Alguns na África avançaram,
  • 00:31:32
    outros africanos ficaram presos por guerras civis, outros afetados pelo HIV.
  • 00:31:37
    E agora vemos o mundo com as estatísticas mais atualizadas.
  • 00:31:42
    A maior parte das pessoas hoje vive no meio.
  • 00:31:45
    Mas já uma imensa diferença
  • 00:31:48
    entre os melhores e piores países.
  • 00:31:51
    Também existem enormes desigualdades dentro dos países.
  • 00:31:55
    As bolhas mostram as médias dos países, mas eu posso dividí-las.
  • 00:31:59
    Pegue a China. Eu posso dividí-la entre províncias.
  • 00:32:02
    Lá vai Xangai...
  • 00:32:05
    Ela tem a mesma riquesa e saúde da Itália hoje.
  • 00:32:08
    E lá vai a pobre província interiorana de Guizhou,
  • 00:32:11
    ela é como o Paquistão.
  • 00:32:12
    E se eu dividir mais ainda, as partes rurais são como Gana na África.
  • 00:32:19
    Ainda assim, apesar das enormes disparidades atuais,
  • 00:32:23
    nós tivemos 200 anos de progresso incrível!
  • 00:32:27
    A enorme diferença histórica entre ocidente e o resto está diminuindo.
  • 00:32:31
    Nós nos tornamos um mundo totalmente novo, convergente.
  • 00:32:35
    E eu vejo um claro padrão par ao futuro.
  • 00:32:38
    Com assistência, comércio, tecnologias verdes e paz,
  • 00:32:41
    é plenamente possível que todos possam chegar
  • 00:32:43
    ao canto rico e saudável.
  • 00:32:48
    Bom, o que vocês viram nos ultimos minutos
  • 00:32:51
    é uma história de 200 países mostrada em 200 anos e além.
  • 00:32:56
    Envolveu a plotagem de 120.000 números.
  • 00:33:00
    Bacana, né?
  • 00:33:07
    Então, com as estatísticas, podemos começar a ver as coisas como elas realmente são.
  • 00:33:13
    De tabelas com dados a médias, distribuições e visualizações,
  • 00:33:18
    as estatísticas nos deram uma visão clara do mundo.
  • 00:33:22
    Mas, com estatísticas, podemos não somente descobrir O QUE está acontecendo
  • 00:33:28
    mas também explorar PORQUE
  • 00:33:30
    ao usar um método analítico poderoso - correlação.
  • 00:33:35
    Olhar pra apenas uma coisa de cada vez não nos diz muita coisa.
  • 00:33:38
    Temos que olhar para o relacionamento entre as coisas,
  • 00:33:41
    como elas mudam, como elas variam juntas.
  • 00:33:43
    É assim que age a correlação.
  • 00:33:45
    É assim que começamos a tentar entender os processos
  • 00:33:48
    que realmente acontecem no mundo e na sociedade.
  • 00:33:52
    A maioria hoje reconhece que crime se correlaciona com pobreza,
  • 00:33:57
    que infecção se correlaciona com saneamento ruim,
  • 00:33:59
    e que conhecimento de estatística se correlaciona
  • 00:34:02
    com ser bom de dança!
  • 00:34:06
    As correlações podem ser complicadas.
  • 00:34:10
    Eu recebi uma piada sobre correlações bobas.
  • 00:34:12
    Um americano tinha medo de ataque do coração.
  • 00:34:15
    Ele descobriu que os japoneses comem pouquíssima gordura
  • 00:34:19
    e quase não bebem vinho,
  • 00:34:22
    mas tinham muito menos ataques cardíacos que os americanos.
  • 00:34:25
    Mas, por outro lado, ele também descobriu que os franceses
  • 00:34:28
    comem tanta gordura quanto os americanos, e bebem
  • 00:34:31
    muito mais vinho, mas têm menos ataques cardíacos.
  • 00:34:35
    Então ele concluiu que o que mata é falar inglês.
  • 00:34:40
    Fume, fume fume esse cigarro,
  • 00:34:43
    Trague, trague, trague, e se você fumar até a morte...
  • 00:34:48
    O tempo, o ritmo, o cigarro. Weights Tilt.
  • 00:34:51
    O melhor exemplo de uma correlação inovadora
  • 00:34:56
    é a ligação que foi estabelecida nos anos 1950 entre o fumo e câncer de pulmão.
  • 00:35:01
    Pouco após o fim da Segunda Guerra Mundial, um médico britânico, Richard Doll,
  • 00:35:07
    invetigou pacientes de câncer de pulmão em 20 hospitais de Londres.
  • 00:35:11
    E ele ficou convencido que a única coisa que eles tinham em comum era o fumo.
  • 00:35:15
    Teve tanta certeza que parou de fumar.
  • 00:35:18
    Mas outras pessoas não tinham tanta certeza.
  • 00:35:22
    Grande parte da discussão sobre os dados iniciais
  • 00:35:25
    ligando fumo com câncer, dizia "Certamente não é o fumo,"
  • 00:35:29
    "isso que fizemos a vida toda, isso não deve fazer mal."
  • 00:35:32
    "Talvez sejam os genes."
  • 00:35:35
    "Talvez pessoas que são pré-dispostas geneticamente para ter câncer de pulmão"
  • 00:35:39
    "também são pré-dispostas geneticamente a fumar."
  • 00:35:43
    "Talvez não seja o cigarro, e sim a poluição do ar"
  • 00:35:47
    "fumantes de alguma forma são mais expostos a poluição do ar que os não fumantes."
  • 00:35:52
    "Talvez não seja o cigarro, e sim a pobreza."
  • 00:35:56
    Então agora temos três explicações alternativas, além do simples azar.
  • 00:36:02
    Para verificar que a sua correlação implicava causa e efeito,
  • 00:36:06
    Richard Doll criou o maior estudo estatístico sobre o fumo até então.
  • 00:36:10
    Ele começou a seguir a vida de 40.000 médicos britânicos,
  • 00:36:14
    alguns dos quais fumavam e outros não,
  • 00:36:17
    e juntou dados suficientes
  • 00:36:19
    para correlacionar a quantidade de médicos que fumavam
  • 00:36:22
    com suas possibilidades de pegar câncer.
  • 00:36:24
    Eventualmente, ele mostrou não só uma correlação entre o fumo e o câncer de pulmão,
  • 00:36:30
    mas também uma correlação entre parar de fumar e a redução do risco.
  • 00:36:35
    Isso era a ciência em seu melhor.
  • 00:36:39
    O que as correlações não substituem é o pensamento humano.
  • 00:36:44
    Você tem que pensar sobre o que aquilo significa.
  • 00:36:46
    O que um bom cientista faz, se ele chega a uma correlação,
  • 00:36:51
    é tentar refutá-la o quanto for possível,
  • 00:36:55
    tentar desconstruí-la, se livrar dela, tentar contestá-la.
  • 00:37:00
    Se ela aguentar todos esses esforços para destruí-la
  • 00:37:05
    e ainda estiver de pé, então, cautelosamente, você diz: "Podemos mesmo ter algo aqui".
  • 00:37:26
    Por mais brilhante que seja o cientista, os dados ainda são o oxigênio da ciência.
  • 00:37:32
    A boa notícia é que com mais dados, vamos achar
  • 00:37:36
    mais correlações, testaremos mais teorias,
  • 00:37:39
    e mais descobertas serão possíveis.
  • 00:37:46
    E a história mostra como nossa soma total de
  • 00:37:49
    informação salta ao desenvolvermos novas tecnologias.
  • 00:37:53
    A invenção da prensa móvel iniciou a primeira explosão de dados e informações.
  • 00:38:00
    Se você empilhar todos os livros que foram impressos até o ano 1700,
  • 00:38:06
    teríamos 60 pilhas, cada uma com a altura do Monte Evetest.
  • 00:38:12
    Então, começando no século 19,
  • 00:38:15
    veio a segunda revolução da informação com o telégrafo,
  • 00:38:19
    gramofone e câmera. E depois, rádio e TV.
  • 00:38:23
    A quantia total de informações explodiu.
  • 00:38:28
    E nos anos 1950 a informação disponível a todos nós tinha se multiplicado 6000 vezes.
  • 00:38:35
    Então, graças ao computador e mais tarde à internet, ficamos digitais.
  • 00:38:41
    E a quantia de dados que temos agora é inimaginavelmente vasta.
  • 00:38:49
    Uma única letra impressa em um livro é equivalente a um byte de dados.
  • 00:38:55
    Uma página impressa equivale a um ou dois kilobytes.
  • 00:39:01
    Cinco megabytes são suficientes para toda a obra de Shakespeare.
  • 00:39:08
    10 gigabytes - isso é um filme em DVD.
  • 00:39:16
    Dois terabytes são as dezenas de milhões de fotos adicionadas ao Facebook todo dia.
  • 00:39:24
    Dez petabytes é a quantia de dados gerada a cada
  • 00:39:28
    segundo pelo maior acelerador de partículas do mundo.
  • 00:39:32
    É tanto que só uma pequena fração é gravada.
  • 00:39:35
    Seis exabytes é o que você teria se sequenciasse os genomas de todas as pessoas do planeta.
  • 00:39:48
    Mas na verdade, isso não é nada.
  • 00:39:50
    Em 2009, a internet somava até 500 exabytes.
  • 00:39:55
    Em 2010, em apenas um ano, isso vai dobrar pra mais de um zetabyte!
  • 00:40:06
    De volta ao mundo real, se transformássemos todos
  • 00:40:09
    esses dados em livros, isso daria 90 pilhas de livros,
  • 00:40:14
    cada uma indo daqui até o Sol!
  • 00:40:18
    O dilúvo de dados é desconcertante, mas com os computadores atuais,
  • 00:40:23
    e com a estatística, tenho confiança de que podemos lidar com isso.
  • 00:40:27
    Na questão dos dados de toda a internet,
  • 00:40:31
    a potência de análise estatística
  • 00:40:34
    é o gigante do Vale do Silício, Google.
  • 00:40:40
    São feitas 1 bilhão de buscas no Google todo dia.
  • 00:40:44
    Uma pessoa comum em sua vida toda é exposta a mais
  • 00:40:47
    ou menos 100 milhões de palavras em conversas.
  • 00:40:50
    E se você multiplicar isso pelas 6 bilhões de pessoas no planeta,
  • 00:40:54
    essa quantia de palavras é parecida com o número de palavras
  • 00:40:58
    que a Google tem disponível a qualquer momento.
  • 00:41:03
    Os computadores da Google rastreiam e arquivam cada
  • 00:41:06
    palavra, página e imagem que conseguem encontrar.
  • 00:41:08
    Então eles caçam por padrões e correlações nesses dados,
  • 00:41:14
    fazendo estatística em uma escala gigantesca.
  • 00:41:17
    E, pra mim, eles têm um projeto que é particularmente
  • 00:41:21
    animador - tradução linguística estatística.
  • 00:41:25
    Queríamos garantir acesso a todas as informações na web, independente da língua falada.
  • 00:41:30
    Existe tanta informação na internet,
  • 00:41:33
    que seria completamente impossível traduzir
  • 00:41:35
    tudo manualmente em todas as línguas possíveis.
  • 00:41:37
    Decidimos que teríamos que conseguir fazer tradução automática.
  • 00:41:44
    No passado, os programadores tentavam ensinar seus computadores
  • 00:41:47
    a ver cada língua como um grupo de regras gramáticas.
  • 00:41:50
    Da mesma forma que línguas são ensinadas nas escola.
  • 00:41:53
    Mas isso não funcionou porque nenhum conjunto de regras consegue encapsular uma língua,
  • 00:41:58
    com todas suas sutilezas e ambiguidades.
  • 00:42:01
    "Tendo comido nosso almoço, o ônibus partiu".
  • 00:42:05
    Bom, isso está obviamente incorreto.
  • 00:42:07
    Escrito assim, faz acreditar que o ônibus comeu o almoço.
  • 00:42:12
    Seria muito melhor dizer
  • 00:42:15
    "tendo comido nosso almoço, nós partimos no ônibus".
  • 00:42:19
    Essas regras são úteis e ajudam na maioria das vezes, mas nem sempre são verdade.
  • 00:42:26
    E a idéia de usar tradução estatística automática é dizer,
  • 00:42:30
    "Se você tem todas essas exceções, talvez dê pra trabalhar sem usar regra alguma.
  • 00:42:35
    "Talvez você possa tratar tudo como excessão." E é exatamente isso que fizemos.
  • 00:42:44
    Fala 3 de uma estimativa de 7.358 línguas existentes.
  • 00:42:48
    O que o computador está fazendo quando está aprendendo a traduzir
  • 00:42:52
    é aprender as correlações entre palavras
  • 00:42:55
    e correlações entre frases.
  • 00:42:57
    Então nós alimentamos o sistema com enormes quantias de dados
  • 00:43:00
    e então o sistema vê que uma determinada palavra ou frase
  • 00:43:04
    se correlaciona com frequência a outra língua.
  • 00:43:09
    O site da Google oferece atualmente tradução entre 57 línguas diferentes.
  • 00:43:15
    E faz isso de forma puramente estatística, tendo
  • 00:43:18
    correlacionado uma enorme coleção de textos multilíngues.
  • 00:43:22
    As pessoas que construíram o sistema não precisaram aprender chinês
  • 00:43:25
    para construir o sistema de chinês-para-inglês, assim como não precisaram saber árabe.
  • 00:43:29
    O conhecimento necessário é basicamente conhecimento de estatística,
  • 00:43:33
    conhecimento de ciência da computação e conhecimento de infraestrutura
  • 00:43:35
    para construir os enormes sistemas computacionais que estamos construindo para fazer isso.
  • 00:43:42
    Eu me conectei com a Google do meu escritório em
  • 00:43:45
    Estocolmo para tentar o tradutor por conta própria.
  • 00:43:48
    'Eu vou digitar algumas sentenças em sueco.'
  • 00:43:51
    OK.
  • 00:44:00
    OK. Ele está dizendo, "O ministro de finanças da Suécia
  • 00:44:04
    tem um rabo de cavalo e um brinco de ouro na sua orelha."
  • 00:44:07
    Imagino que signifique na orelha dele. 'Correto, isso é incrível!'
  • 00:44:11
    'Ele vem do partido Conservador, esse é o tipo de Suécia que temos hoje'
  • 00:44:15
    'Vou digitar mais uma sentença.'
  • 00:44:28
    "Em seu relacionamento de mesmo sexo tem o novo bispo
  • 00:44:31
    de Estocolmo e seus parceiros um filho de três anos."
  • 00:44:35
    Está quase perfeito, tem uma coisa importante
  • 00:44:38
    é DELA, é um relacionamento lésbico.
  • 00:44:41
    Ok, então esses tipos de palavras, dele ou dela são um dos desafios
  • 00:44:46
    na tradução pra acertar realmente.
  • 00:44:49
    Especialmente quando estamos falando de bispas, temos que dar um desconto!
  • 00:44:51
    'Certo, certo.'
  • 00:44:53
    Eu acho que é uma palavra que é entendida com mais
  • 00:44:55
    frequência como "ele". 'Vou escrever mais uma sentença.'
  • 00:45:06
    OK. "Quando a Suécia participa das Olimpídas,
  • 00:45:09
    o objetivo não é vencer, mas vencer a Noruega."
  • 00:45:11
    'Sim! É isso que diz!'
  • 00:45:13
    'Mas eles são muito bons nas Olimpíadas de Inverno,
  • 00:45:15
    então não conseguimos, mas estamos tentando.'
  • 00:45:17
    Ah, muito bom, muito bom.
  • 00:45:19
    'Isso é incrível, e fiquei especialmente impressionado'
  • 00:45:24
    'que ele tenha reconhecido palavras como "relacionamento
  • 00:45:28
    de mesmo sexo", que são muito novas na língua.'
  • 00:45:30
    'O tradutor é bom, mas se eles conseguirem fazer o que vem a seguir, vai ser fantástico.'
  • 00:45:36
    Uma das possibilidades animadoras
  • 00:45:38
    é a combinação de tradução automática com a tecnologia de reconhecimento de fala.
  • 00:45:42
    Ambas são de natureza estatística.
  • 00:45:45
    A tradução automática depende de estatísticas para mapear uma linguagem à outra,
  • 00:45:51
    e o reconhecimento de fala depende das estatísticas
  • 00:45:54
    para mapear da forma sonora para palavras.
  • 00:45:57
    Quanto as colocamos juntas,
  • 00:45:59
    então temos a capacidade de ter conversas instantâneas
  • 00:46:03
    entre duas pessoas que não falam uma língua em comum.
  • 00:46:06
    Eu posso falar com você na minha língua,
  • 00:46:08
    você me escuta na sua língua e me responde de volta.
  • 00:46:11
    E em tempo real podemos fazer essa tradução,
  • 00:46:15
    podemos reunir duas pessoas e permitir que elas conversem.
  • 00:46:31
    A internet é só uma dessas muitas tecnologias
  • 00:46:34
    criadas para coletar quantidades imensas de dados.
  • 00:46:39
    Cientistas estudando a Terra e o nosso meio ambiente
  • 00:46:43
    hoje usam uma gama incrível de instrumentos
  • 00:46:47
    para medir os processos do nosso planeta.
  • 00:46:52
    À nossa volta, sensores medem continuamente
  • 00:46:55
    temperatura, fluxo das águas e correntes oceânicas.
  • 00:46:59
    E em órbita, estão satélites ocupados em fotografar
  • 00:47:03
    formações de nuvens, crescimento de florestas e geleiras.
  • 00:47:06
    Os cientistas falam em "instrumentalizar a Terra".
  • 00:47:13
    E apontando para os céus estão novos e poderosos telescópios, mapeando o universo.
  • 00:47:30
    O que está acontecendo na astronomia é típico de como essa torrente de dados
  • 00:47:34
    está transformando a ciência.
  • 00:47:39
    Astrônomos estão agora respondendo mistérios persistentes do cosmos
  • 00:47:45
    ao aplicarem métodos estatísticos a esses novos dados.
  • 00:47:54
    Vive em uma galáxia com mais de 200.000.000.000 de estrelas.
  • 00:47:59
    A galáxia é um lugar muito grande e contém bilhões de estrelas,
  • 00:48:03
    então para juntar um quadro coerente da galáxia
  • 00:48:06
    inteira demanda uma quantia enorme de dados.
  • 00:48:09
    E antes que pudéssemos fazer uma pesquisa dos céus com sensores digitais,
  • 00:48:13
    o que significa mapear muitas, muitas estrelas de uma vez,
  • 00:48:16
    era muito difícil coletar dados suficientes sobre a galáxia.
  • 00:48:24
    No passado, grandes pesquisas do céu noturno tinham que ser feitas
  • 00:48:28
    com a esposição de milhares de enormes placas fotográficas.
  • 00:48:32
    Mas essas pesquisas podiam demorar 25 anos ou mais.
  • 00:48:39
    Então, nos anos 1990, veio a astronomia digital, e um enorme aumento
  • 00:48:44
    tanto da quantidade, quanto da acessibilidade dos dados.
  • 00:48:49
    A Sloan Sky Survey é a maior pesquisa desse
  • 00:48:52
    tipo até hoje, usando um imenso sensor digital
  • 00:48:55
    montado em um telescópio no Novo México.
  • 00:49:00
    Ele escaneou o céu noturno todas as noites por oito anos,
  • 00:49:05
    criando uma imagem composta com resolução sem precedentes.
  • 00:49:09
    A Sloan é uma das melhores e mais profundas pesquisas de dados que temos na astronomia.
  • 00:49:14
    Tanto da nossa galáxia, quanto de outras mais distantes de nós.
  • 00:49:24
    Todos os dados da Sloan estão na internet,
  • 00:49:27
    e com eles, os astrônomos identificaram milhões
  • 00:49:30
    de estrelas e galáxias até então desconhecidas.
  • 00:49:34
    Eles também varrem a base de dados por padrões estatísticos
  • 00:49:37
    que irão provar, refutar, ou até sugerir novas teorias.
  • 00:49:42
    Temos uma idéia de como as galáxias crescem, como elas
  • 00:49:45
    se tornam enormes como a em que vivemos, a Via Láctea,
  • 00:49:49
    não é de uma só vez, ou ordenadamente, mas ao incorporar continuamente,
  • 00:49:55
    basicamente canibalizando galáxias menores.
  • 00:49:59
    Elas as dissolvem e se tornam parte da galáxia maior, que vai crescendo.
  • 00:50:06
    É uma idéia incrível, e nos dados da Sloan, temos evidências disso.
  • 00:50:12
    Grupos de estrelas que vieram de galáxias canibalizadas
  • 00:50:16
    se sobressaem nos dados da Sloan como sendo
  • 00:50:18
    estatísticamente diferentes de outras estrelas,
  • 00:50:21
    porque elas se movem com velocidades diferentes.
  • 00:50:24
    Cada pico nesses gráficos de distribuição
  • 00:50:28
    significa que a Professora Rockosi achou um grupo de
  • 00:50:31
    estrelas viajando de maneira diferente das outras.
  • 00:50:35
    Esses são os padrões chave que ela está procurando.
  • 00:50:40
    As evidências aumentam para o fato de que
  • 00:50:42
    realmente é dessa forma que as galáxias crescem,
  • 00:50:44
    ou pelo menos, uma das principais formas de como isso acontece.
  • 00:50:47
    E isso é uma parte importante no entendimento de
  • 00:50:50
    como as galáxias nascem, não só a nossa, mas todas.
  • 00:50:56
    Quanto maior a quantidade de dados, mais descobertas podem ser feitas.
  • 00:51:00
    E a tecnologia está melhorando o tempo todo.
  • 00:51:04
    O próximo grande telescópio de pesquisa começará a funcionar em 2015.
  • 00:51:07
    Ele vai deixar a Sloan comendo poeira!
  • 00:51:10
    A Sloan demorou oito anos para cobrir um quarto do céu noturno.
  • 00:51:17
    O novo telescópio vai escanear o céu inteiro,
  • 00:51:21
    em resolução maior ainda, a cada três dias!
  • 00:51:34
    As vastas quantidades de dados que temos hoje
  • 00:51:37
    permitem que pesquisadores de diversas áreas
  • 00:51:41
    testem suas teorias em uma escala que antes era inimaginável.
  • 00:51:46
    Mais do que isso, pode um dia mudar fundamentalmente a forma de se fazer ciência.
  • 00:51:53
    Com o poder dos computadores modernos aplicado a esses dados todos,
  • 00:51:58
    as máquinas podem ser capazes de guiar os pesquisadores.
  • 00:52:07
    Cada célula de seu corpo tem 2 metros de DNA (20 bilhões de Km no total)
  • 00:52:14
    Estamos em um ponto profundamente importante,
  • 00:52:17
    potencialmente um dos mais significativos da ciência.
  • 00:52:22
    E certamente um dos mais animadores,
  • 00:52:24
    onde o potencial de transformar não só como os cientistas
  • 00:52:28
    fazem a ciência, mas até o que é possível com a ciência.
  • 00:52:32
    E o que vai impulsionar essa transformação
  • 00:52:34
    de como ela e feita, e o que é possível fazer com ela
  • 00:52:38
    vai ser a computação.
  • 00:52:41
    Muitas das dinâmicas do mundo natural, como a interação das florestas com a atmosfera,
  • 00:52:49
    são tão complexas que não as entendemos de fato.
  • 00:52:53
    Mas agora os computadores estão gerando literalmente
  • 00:52:56
    dezenas de milhares de simulações diferentes
  • 00:52:59
    de como esses sistemas biológicos funcionam.
  • 00:53:03
    É como se criasse milhares de mundos paralelos hipotéticos.
  • 00:53:07
    E cada uma dessas simulações
  • 00:53:10
    é analisada estatísticamente para ver se
  • 00:53:14
    correspondem com o que é observado na natureza.
  • 00:53:18
    Os computadores agora podem gerar e testar hipóteses
  • 00:53:21
    automaticamente, sem quase nenhuma interação humana.
  • 00:53:28
    Essa nova aplicação da estatística se tornará
  • 00:53:31
    absolutamente vital para o futuro da ciência.
  • 00:53:35
    Está criando um novo paradigma
  • 00:53:39
    na ciência, no modo em que fazemos a ciência.
  • 00:53:42
    Que é cada vez mais...
  • 00:53:45
    Que poderíamos classificar como... dirigida por dados, ou centrada em dados
  • 00:53:50
    ao invés de centrada em hipóteses ou experimentos.
  • 00:53:55
    Então, são tempos emocionantes em termos da ciência,
  • 00:53:58
    em termos da computação e em termos da estatística.
  • 00:54:08
    Mas se isso soa um pouco abstrato e teórico para você, que tal uma fronteira final?
  • 00:54:15
    Poderia a estatística dar sentido aos nossos sentimentos?
  • 00:54:21
    - Na California - onde mais? - Um cientista da computação
  • 00:54:25
    está vasculhando a internet para tentar encontrar
  • 00:54:29
    os padrões dos nossos pensamentos e emoções.
  • 00:54:36
    Se sente feliz 78% do tempo.
  • 00:54:44
    Esse é o movimento da loucura.
  • 00:54:46
    O movimento da loucura representa o mundo visto de longe.
  • 00:54:50
    Cada um desses pontos coloridos é um sentimento individual
  • 00:54:54
    expressado por alguém em um blog ou um tweet.
  • 00:54:58
    Quando você clica no ponto ele explode para revelar o sentimento daquela pessoa.
  • 00:55:04
    Isso é o que as pessoas estão dizendo de como se sentem hoje.
  • 00:55:07
    Melhor... segura
  • 00:55:10
    uma droga
  • 00:55:12
    bem
  • 00:55:14
    bonita... especial
  • 00:55:17
    triste... sozinho...
  • 00:55:25
    Então, a cada minuto, o We Feel Fine varre os blogs do mundo,
  • 00:55:29
    pega todas as sentenças que começam com "estou" ou "me sinto",
  • 00:55:34
    e as coloca num banco de dados.
  • 00:55:35
    Coletamos esses sentimentos e contamos os mais comuns.
  • 00:55:40
    Eles são melhor... mal
  • 00:55:43
    bom... certo
  • 00:55:45
    culpado... doente
  • 00:55:48
    igual... uma merda
  • 00:55:51
    triste... bem
  • 00:55:54
    e assim por diante.
  • 00:55:58
    E podemos pegar qualquer sentimento e analizá-lo.
  • 00:56:01
    No momento muitas pessoas estão felizes.
  • 00:56:04
    Podemos olhar para todas as pessoas que estão
  • 00:56:07
    felizes e dividí-las em idade, sexo ou localização.
  • 00:56:10
    Como os eles têm perfis públicos, temos essa
  • 00:56:13
    informação, então podemos fazer perguntas como,
  • 00:56:16
    "As mulheres são mais felizes que os homens" ou,
  • 00:56:19
    "A Inglaterra é mais feliz que os Estados Unidos?"
  • 00:56:30
    Descobrimos que, à medida que as pessoas envelhecem, ficam mais felizes.
  • 00:56:33
    E, além disso, vimos que pessoas mais jovens associam felicidade mais com excitação,
  • 00:56:40
    e à medida que as pessoas envelhecem, associam felicidade mais com tranquilidade.
  • 00:56:51
    Também vimos que as mulheres se sentem amadas
  • 00:56:54
    mais que os homens, mas também mais culpadas.
  • 00:56:57
    Enquanto os homens se sentem bem mais que as mulhares, mas também mais sozinhos.
  • 00:57:06
    À medida que as pessoas vivem mais de suas vidas
  • 00:57:09
    online, elas deixam para trás traços digitais,
  • 00:57:12
    e esses traços podem começar a analisar estatísticamente o que significa ser um humano.
  • 00:57:51
    Então, onde isso tudo nos leva?
  • 00:57:54
    Geramos quantidades inimagináveis de dados sobre tudo que pudermos pensar.
  • 00:58:00
    Analizamos para revelar os padrões.
  • 00:58:02
    E agora, não só os experts, mas qualquer um de nós
  • 00:58:06
    pode entender as histórias contidas nesses números.
  • 00:58:18
    Ao invés de nos perdemos por preconceito,
  • 00:58:21
    com as estatísticas às nossas mãos, nossos olhos podem
  • 00:58:24
    se abrir para uma visão do mundo baseada em fatos.
  • 00:58:28
    Então, mais do que nunca, podemos nos tornar autores do nosso próprio destino.
  • 00:58:33
    E isso é bem emocionante, não é?!
  • 00:58:38
    Enquanto você assistia esse filme...
  • 00:58:44
    Pessoas comeram 7.092 toneladas de bananas.
タグ
  • estatísticas
  • dados
  • visualização
  • Saúde Global
  • Google
  • tradução estatística
  • Sloan Sky Survey
  • dados públicos