O Prazer da Estatística (Documentário-2010)
Zusammenfassung
TLDRO vídeo destaca o poder das estatísticas na interpretação de dados e na descoberta de verdades sobre o mundo. As estatísticas não apenas nos permitem entender fenômenos sociais e naturais, mas também capacitam cidadãos, responsabilizam governos e orientam políticas públicas. A visualização de dados se torna uma ferramenta crítica na comunicação de informações e na análise de tendências. A apresentação explora o impacto dos computadores modernos na ciência e na capacidade analítica, permitindo uma revolução na forma como compreendemos nosso contexto social e emocional.
Mitbringsel
- 📊 As estatísticas dão sentido a grandes quantidades de dados.
- 💻 Computadores modernos ampliam a capacidade de analisar informações.
- 📈 A visualização transforma dados complexos em insights acessíveis.
- 🏥 Estatísticas são essenciais para a compreensão da saúde global.
- 🌍 Dados permitem responsabilizar governos e fomentar mudanças sociais.
- ⚖️ A análise estatística informa sobre desigualdades sociais.
- 📉 A distribuição normal é uma forma comum em diversos dados.
- 🔗 Estatísticas ajudam a relacionar fenômenos sociais e naturais.
- 🧐 A capacidade de analisar dados pode revolucionar a ciência.
- 💬 As estatísticas podem nos ajudar a entender emoções e sentimentos.
Zeitleiste
- 00:00:00 - 00:05:00
O mundo está inundado de dados, mas apenas a estatística permite que compreendamos esse dilúvio, dando significado e entendimento ao que observamos ao nosso redor. Hoje, com o uso de computadores modernos, a estatística se tornou essencial para a descoberta científica e transforma o cenário do conhecimento global.
- 00:05:00 - 00:10:00
Uma visualização da saúde global, representada por bolhas que simbolizam países, nos mostra correlações entre riqueza e saúde. A narrativa se desenvolve por meio de uma corrida entre diferentes países, explorando como suas trajetórias ao longo da história refletem a interação entre crescimento econômico e indicadores de saúde.
- 00:10:00 - 00:15:00
A cidade de São Francisco exemplifica o uso de dados públicos para mapear crimes, oferecendo transparência e permitindo que os cidadãos se tornem mais engajados na segurança pública. Dados interativos permitem análise de padrões, tornando os cidadãos mais informados sobre suas comunidades e revelando desigualdades que podem ser abordadas com responsabilidade social.
- 00:15:00 - 00:20:00
Os cidadãos de São Francisco exigem mudanças no policiamento baseadas em dados, mostrando como as estatísticas públicas podem influenciar políticas e práticas de serviços. Isso ocorre em um contexto onde a visibilidade das desigualdades sociais aumenta, promovendo um diálogo mais construtivo entre a população e as autoridades.
- 00:20:00 - 00:25:00
As estatísticas têm uma longa história, onde os governos começaram a coletar dados para aprimorar seu entendimento sobre a população, como exemplificado pelo Tabellverket na Suécia. Esses dados revelaram uma realidade chocante que levou a um futuro de mudanças significativas na saúde pública do país.
- 00:25:00 - 00:30:00
O século 19 viu um crescimento na demanda por dados na Europa, com a formação de sociedades científicas que promoviam o uso de estatísticas. Essas estatísticas permitiram a análise social mais profunda, onde números começaram a contar histórias sobre a sociedade e suas transformações.
- 00:30:00 - 00:35:00
Os primeiros estatísticos se focaram na média, capturando vastas quantidades de dados, mas um bom entendimento requer a análise da variação e a visualização dos dados. Formas como a distribuição normal ajudaram a identificar padrões e regularidades nos dados coletados.
- 00:35:00 - 00:40:00
Florence Nightingale foi uma pioneira na visualização de dados, utilizando gráficos para demonstrar padrões que poderiam salvar vidas, destacando a importância da apresentação visual na ciência. Suas inovações mudaram o modo como interpretamos dados em áreas críticas como saúde.
- 00:40:00 - 00:45:00
A produção de gráficos e imagens é essencial para a comunicação pública de dados. Hoje, animações e visualizações interativas tornam os dados mais acessíveis e compreensíveis, permitindo que mais pessoas se conectem com a realidade que esses números representam.
- 00:45:00 - 00:50:00
A relação entre dados e padrões é evidente em temas como a mortalidade em acidentes de trânsito, onde as estatísticas revelam regularidades surpreendentes que podem ser analisadas e discutidas em termos sociais, oferecendo uma visão holística das questões de segurança e saúde pública.
- 00:50:00 - 00:59:22
Com o poder da computação e da internet, a quantidade de dados gerados está em constante crescimento. A estatística, aliada a tecnologias modernas, está possibilitando novas fronteiras na compreensão de fenômenos, desde o comportamento humano até as dinâmicas ambientais.
Mind Map
Video-Fragen und Antworten
O que as estatísticas podem nos ajudar a entender?
As estatísticas nos ajudam a entender relações entre dados, interpretar fenômenos sociais, e nos dar uma visão do mundo baseada em fatos.
Por que as estatísticas são consideradas importantes atualmente?
Elas agora são essenciais para lidar com a enorme quantidade de dados disponíveis, permitindo uma melhor análise e compreensão do mundo.
Como os computadores modernos afetam a estatística?
Os computadores modernos aumentam a capacidade de processamento de dados, permitindo descobertas mais rápidas e precisas.
Qual é a relação entre estatísticas e saúde global?
As estatísticas permitem acompanhar e entender pioras e melhorias na saúde global ao longo do tempo.
Qual é o impacto da visualização de dados?
A visualização de dados facilita o entendimento e a interpretação de informações complexas.
Como as estatísticas podem influenciar políticas governamentais?
As estatísticas ajudam a identificar desigualdades e áreas que precisam de melhoria, responsabilizando governos para agir.
O que é a distribuição normal nas estatísticas?
É uma forma comum encontrada em muitos conjuntos de dados que demonstra como as variáveis estão distribuídas.
Como as estatísticas podem informar sobre questões sociais?
Elas podem revelar padrões, como a relação entre criminalidade e pobreza, e ajudar a informar sobre políticas públicas.
Qual a relação entre as estatísticas e a ciência?
As estatísticas são fundamentais na pesquisa científica, pois ajudam a validar hipóteses e descobertas.
O que a fundação Gapminder faz?
Ela utiliza dados internacionais para ajudar a entender e apresentar informações sobre a saúde e desenvolvimento global.
Weitere Video-Zusammenfassungen anzeigen
- 00:00:03O mundo em que vivemos está repleto de dados que chovem por todos os lados.
- 00:00:10Sozinhos, esses dados são apenas barulho e confusão.
- 00:00:14Para dar sentido a eles, achar significado, precisamos de um ramo poderoso da ciência - estatística.
- 00:00:22Acredite em mim, não tem nada de chato nas estatísticas.
- 00:00:26Especialmente hoje em dia, quando podemos fazer os dados cantarem.
- 00:00:29Com a estatística podemos realmente entender o mundo.
- 00:00:33E tem mais.
- 00:00:35Com a estatística, o dilúvio de dados, como é chamada, está nos levando
- 00:00:40a um maior entendimento da vida na Terra e no universo afora.
- 00:00:46E graças ao incrível poder dos computadores modernos,
- 00:00:50ela pode ser fundamental para transformar o processo de descoberta científica.
- 00:00:57Sem brincadeira, a estatística é agora o assunto mais sexy que existe.
- 00:01:23Você sabia que existem um milhão de barcos na Suécia?
- 00:01:25Isso dá um barco a cada 9 pessoas!
- 00:01:27É o número mais alto de barcos por pessoa da Europa.
- 00:01:31A Suécia também tem o maior número de McDonalds, computadores e reatores nucleares por pessoa da Europa
- 00:01:41Os estatísticos geralmente não gostam de dizer sua profissão numa festa.
- 00:01:45Mas na verdade, os estatísticos não deveriam se envergonhar
- 00:01:48porque todos querem entender o que está acontecendo.
- 00:01:51E a estatística nos dá perspectiva sobre o mundo em que vivemos
- 00:01:56que não poderíamos ter de outro modo.
- 00:02:00As pessoas passam em média 24 anos de suas vidas dormindo
- 00:02:04As estatísticas nos dizem se as coisas que pensamos e acreditamos são mesmo verdade.
- 00:02:10A maiora dos homens acham que dirigem melhor que as mulheres
- 00:02:14Mas têm em média o dobro de acidentes fatais por km dirigido
- 00:02:20E as estatísticas são muito mais úteis do que geralmente gostamos de admitir.
- 00:02:25Na última recessão, houve essa famosa ligação para um talk-show no rádio.
- 00:02:29O homem reclamou, "Em tempos como esses, quando o desemprego está em 13%, a renda baixou 5%,
- 00:02:37"e com índices de suicídio subindo, eu fico muito revoltado quando o governo
- 00:02:41"está desperdiçando dinheiro em coisas como coleta de estatísticas. "
- 00:02:48Eu não sou oficialmente um estatístico.
- 00:02:50Sendo rigoroso, o meu campo é saúde global.
- 00:02:58Mas eu me tornei obcecado com estatísticas quando percebi o quanto as pessoas
- 00:03:03na Suécia não conheciam a respeito do resto do mundo.
- 00:03:06Eu comecei na nossa universidade médica, Karolinska Institutet,
- 00:03:10num curso de graduação chamado Saúde Global.
- 00:03:13Esses estudantes vindo até nós tinham as notas mais altas
- 00:03:17no sistema de ensino sueco,
- 00:03:18então eu pensei, "Talvez eles já saibam tudo o que eu tenho para ensiná-los".
- 00:03:22Então eu fiz um pré-teste quando eles chegaram, e uma das questões
- 00:03:25que me ensinaram muito foi a seguinte -
- 00:03:28qual país tem a taxa mais alta de mortalidade infantil desses 5 pares?
- 00:03:32Eu não vou testá-los, mas é a Turquia
- 00:03:34que tem o mais alto aqui, Polônia,
- 00:03:37Russia, Paquistão, and África do Sul.
- 00:03:40E esse foi o resultado dos estudantes suecos.
- 00:03:431.8 respostas certas de 5 possíveis.
- 00:03:44E isso significa que existe lugar para um professor de Saúde Internacional e para o meu curso.
- 00:03:49Mas uma noite eu estava compilando o relatório, e fiz a minha descoberta.
- 00:03:56Eu mostrei que os melhores estudantes da Suécia sabem estatisticamente
- 00:04:00menos sobre o mundo que os chimpanzés.
- 00:04:06Porque os chimpanzés acertariam a metade.
- 00:04:09Se eu oferecesse duas bananas escrito Sri Lanka e Turquia,
- 00:04:12eles escolheriam a certa na metade dos casos, mas os estudantes não chegaram lá.
- 00:04:15Eu também fiz um antiético estudo dos professores do Karolinska Institutet,
- 00:04:20que escolhe o Prêmio Nobel de medicina, e eles se saíram iguais aos chimpanzés ali.
- 00:04:28Hoje existe mais informação acessível do que em qualquer outra época.
- 00:04:32E eu trabalho com o meu time na Fundação Gapminder
- 00:04:35usando novas ferramentas que ajudarão a todos a entender o mundo mutante.
- 00:04:41Pegamos as enormes quantidades de dados agora disponíveis gratuitamente
- 00:04:45de institutos internacionais como a ONU e o Banco Mundial.
- 00:04:49E a minha missão se tornou compartilhar a compreensão
- 00:04:53desses dados com todos que quiserem ouvir, e para revelar como as estatísticas não são assustadoras.
- 00:05:02Eu vou lhes proporcionar uma visão
- 00:05:05da situação da saúde global em toda a humanidade.
- 00:05:09E vou fazer isso, espero, de uma maneira agradável, então relaxe.
- 00:05:14Então nós fizemos esse programa que mostra dessa forma.
- 00:05:17Cada bolha aqui é um país-
- 00:05:19essa é a China, essa é a India.
- 00:05:21O tamanho da bolha é a população.
- 00:05:23Eu vou fazer uma corrida entre esse Ford amarelo aqui
- 00:05:27e o Toyota vermelho ali embaixo e o Volvo marrom.
- 00:05:32O Toyota começou muito mal aqui embaixo, e os Estados Unidos,
- 00:05:36Ford está fazendo um off-road ali.
- 00:05:38e o Volvo está indo muito bem, esta é a guerra.
- 00:05:40O Toyota está saindo da pista, agora o Toyota está com a saúde da Suécia.
- 00:05:43Isso foi quando eu vendi o Volvo e comprei o Toyota.
- 00:05:47Esse é o Grande Salto Adiante, quando a China caiu.
- 00:05:50Foi o planejamento planificado do Mao Tsé-Tung.
- 00:05:53A China se recuperou e disse, "Chega dessa porcaria planificada",
- 00:05:56mas eles foram lá pra cima.
- 00:05:57Não, existe mais uma disparidade, olhem ali - Estados Unidos
- 00:06:02Eles quebraram meu gráfico. Washington DC é rica a esse ponto,
- 00:06:07mas não tão saudável quanto Kerala, na India. Muito interessante, não?
- 00:06:20Bem-vindos aos EUA, líderes mundiais em carros enormes
- 00:06:25e dados grátis.
- 00:06:28Existem muitos aqui que compartilham da minha visão de dados públicos acessíveis e úteis para todos.
- 00:06:35A cidade de São Francisco está na liderança, abrindo todo tipo de dados.
- 00:06:43Até o departamento de polícia está liberando todos os seus relatórios de crimes.
- 00:06:47Os dados oficiais de crimes foram transformados
- 00:06:50em um lindo mapa interativo por dois gênios da computação da cidade.
- 00:06:55É a estatística de comunidade em ação.
- 00:07:031% de chance de serem vítimas de crimes violentos aqui este ano
- 00:07:09Crimespotting é um mapa de relatórios de crime do Departamento de Polícia de São Francisco
- 00:07:13mostrando pontos em mapas para os cidadãos enxergarem
- 00:07:16padrões de crime em sua vizinhança.
- 00:07:19O mapa não é só sobre crimes indiviuais, mas sobre padrões maiores que mostram onde o crime se
- 00:07:25concentra na cidade, quais áreas têm muito crime,
- 00:07:27e quais áreas têm relativamente pouco crime.
- 00:07:36Estamos no topo da rua Jones na Nob Hill...
- 00:07:42.. uma boa vizinhança.
- 00:07:45O que os mapas de crime nos mostra é a relação entre
- 00:07:49topografia e crime.
- 00:07:51Basicamente, quanto mais alto na colina, menos crime.
- 00:07:56Você atravessa a fronteira
- 00:07:58para as planícies...
- 00:08:02Logo que se chega nas partes baixas da rua Jones, o crime aumenta muitíssimo.
- 00:08:20Estamos aqui no distrito Tenderloin.
- 00:08:26Uma das vizinhanças mais antigas e populosas de São Francisco.
- 00:08:30É aqui que se vem para comprar drogas.
- 00:08:32Logo ali.
- 00:08:37Aqui vemos muitos casos de agressão, muito roubo de carros.
- 00:08:41Uma grande parte do crime da cidade acontece nesse raio de 5 a 6 quarteirões.
- 00:08:55Se você tem ouvido sirenes de polícia na sua vizinhança,
- 00:08:58você pode usar o mapa para descobrir o porquê.
- 00:09:02Se você saiu à noite numa parte da cidade que não conhece,
- 00:09:05pode checar o mapa para ver quais ruas evitar.
- 00:09:09Se um vizinho for assaltado, você pode ver -
- 00:09:12foi isolado ou houve um aumento no crime local?
- 00:09:15Se você passa diáriamente por uma vizinhança e está preocupado
- 00:09:19com a sua segurança, podermos desligar todo
- 00:09:23os crimes noturnos e no meio do dia
- 00:09:25e mostrar as coisas que acontecem durante a sua passagem,
- 00:09:28é uma operação estatística. Mas eu acho que as pessoas que estão interagindo com o mapa
- 00:09:33se sentem como se estivessem navegando num site ou comprando na Amazon.
- 00:09:38Elas olham pros dados e não se dão conta que estão fazendo estatísticas.
- 00:09:43O que é mais animador para mim é que as estatísticas públicas
- 00:09:47estão tornando os cidadãos mais poderosos e as autoridades mais responsáveis.
- 00:09:56Liberou 163 bancos de dados públicos para São Francisco
- 00:10:02Nós temos encontros comunitários que a polícia participa
- 00:10:04onde os cidadãos estão trazendo impressões
- 00:10:08dos mapas que mostram onde os crimes estão acontecendo,
- 00:10:12e estão exigindo serviços do departamento de polícia
- 00:10:16e o departamento de polícia está agora tendo que mudar como eles policiam,
- 00:10:20como eles prestam o serviço de policiamento,
- 00:10:22porque os dados estão mostrando o que funciona e o que não funciona.
- 00:10:28O povo de São Francisco está usando dados públicos
- 00:10:31para mapear desigualdades sociais e ver como melhorar a sociedade.
- 00:10:35E as possibilidades são infinitas.
- 00:10:39Eu acho que o nosso projeto sonho de análise de dados governamentais
- 00:10:43seria focado em informações em tempo real,
- 00:10:46em coisas que vão sendo relatadas para o mundo via internet à medida que vão acontecendo.
- 00:10:51Tipo retiradas de lixo, acidentes de trânsito, ônibus,
- 00:10:54e eu acho que com o poder das estatísticas de dados
- 00:10:57da internet, é possível realmente começar a enxergar como uma cidade funciona,
- 00:11:02apresentada numa interface unificada.
- 00:11:07É para esse caminho que estamos indo.
- 00:11:09Para um mundo onde os dados livres com toda a análise estatística que pode vir deles,
- 00:11:14acessíveis por todos, dando poder aos cidadãos e fazendo com que governantes sejam mais responsáveis.
- 00:11:21Isso é muito além de onde as estatísticas começaram.
- 00:11:26As estatísticas são essenciais para nós monitorarmos nossos governos e nossas sociedades.
- 00:11:32Mas foram nossos governantes que começaram
- 00:11:36a coleção de estatísticas, para poderem nos monitorar melhor!
- 00:11:46Na verdade, a palavra "estatística" vem de "estado".
- 00:11:51A estatística moderna começou dois séculos atrás.
- 00:11:55Quando começou, se espalhou e não parou mais.
- 00:11:59E adivinhe quem foram os pioneiros!
- 00:12:03Os chineses têm o Confúcio, os italianos têm o da Vinci,
- 00:12:07e os britãnicos têm Shakespeare.
- 00:12:10E nós temos a Tabellverket -
- 00:12:12a primeira coleção sistemática de estatísticas!
- 00:12:16Desde o ano 1749 nós coletamos dados
- 00:12:21a cada nascimento, casamento ou morte, e temos muito orgulho disso!
- 00:12:29A Tabellverket gravou informações
- 00:12:32de todas as paróquias da Suécia.
- 00:12:34Foi uma enorme quantidade de dados, e foi a primeira vez que qualquer governo
- 00:12:39pôde ter uma idéia precisa de seu povo.
- 00:12:49A Suécia foi o maior poder militar do Norte da Europa,
- 00:12:53mas em 1749 a nossa estrela estava se apagando,
- 00:12:57outros países estavam ficando mais fortes.
- 00:13:00Pelo menos éramos uma grande potência,
- 00:13:03tida por ter 20 milhões de habitantes, o bastante para fazer frente às rivais França e Inglaterra.
- 00:13:13Mas nós teríamos uma terrível surpresa.
- 00:13:17A primeira análise da Tabellverket
- 00:13:20revelou que a Suécia tinha apenas 2 milhões de habitantes.
- 00:13:24A Suécia não era somente um poder em decadência, mas também tinha uma população muito pequena.
- 00:13:30O governo ficou horrorizado com essa descoberta - e se o inimigo descobrisse?
- 00:13:37Mas a Tabellverket também mostrou que muitas mulheres morriam no parto, e que muitas crianças morriam jovens.
- 00:13:44Então o governo entrou em ação para melhorar a saúde do povo.
- 00:13:48Foi o começo da Suécia moderna.
- 00:13:53Levou mais 50 anos antes que austríacos, belgas, dinamarqueses,
- 00:13:59holandeses, franceses, alemães, italianos
- 00:14:02e, finalmente, os britãnicos, alcançassem os suecos na coleção e uso de estatísticas.
- 00:14:15Professor do Entendimento Público de Risco (60% do tempo)
- 00:14:18Cientista Sênior, Unidade de Bioestatísticas (40% do tempo)
- 00:14:24Foi chamada de aritmérica política. Uma maneira adorável de se referir às estatísticas.
- 00:14:29Os governos podiam ter muito maior controle e entendimento da
- 00:14:33sociedade - como ela funciona, como progride
- 00:14:36e essencialmente eles podiam controlá-la melhor.
- 00:14:43Não foram apenas os governos que acordaram para o poder das estatísticas.
- 00:14:47Na Europa inteira, a sociedade do século 19 estava louca por fatos.
- 00:14:54E, apesar de ter começado tarde, a Inglaterra
- 00:14:57com a sua Sociedade Real de Estatística em Londres,
- 00:15:01logo virou o nirvana dos estatísticos.
- 00:15:05Eu adoro ver essas copias antigas do jornal da Sociedade Real de Estatísticas
- 00:15:09porque está cheio de coisas esquisitas.
- 00:15:11Tem um jornal incrível dos anos 1840
- 00:15:14que mostra um mapa da Inglaterra e as taxas de bastardos em cada região.
- 00:15:19Então você pode identificar rapidamente as áreas com altos índices de bastardismo.
- 00:15:23Estando na Ânglia Oriental, sempre acho divertido que Norfork
- 00:15:27parece estar no topo da "liga dos bastardos" de 1840.
- 00:15:32Um dos fundadores da Sociedade Real de Estatísticas
- 00:15:36foi o grande matemático vitoriano e inventor Charles Babbage.
- 00:15:42Em 1842 ele leu o último poema do igualmente grande vitoriano, Alfred Tennyson.
- 00:15:50Visão do Pecado continha as linhas:
- 00:15:53"Encha a xicara, encha a lata
- 00:15:55"Tenha um despertar antes do amanhecer
- 00:15:58"A todo momento morre um homem Todo momento um nasce. "
- 00:16:03Babbage era tão fixado em estatísticas que não pôde se conter.
- 00:16:07Ele mandou uma carta para Tennyson
- 00:16:09explicando que por causa do crescimento da população,
- 00:16:12a linha deveria ser,
- 00:16:13"A todo momento morre um homem e um e 16 avos nasce. "
- 00:16:18Devo adicionar que o número exato é 1.067,
- 00:16:22mas concessões devem ser feitas para as leis das letras.
- 00:16:31No século 19, estudiosos na europa fizeram um incrível trabalho
- 00:16:36ao medir suas sociedades.
- 00:16:39Eles estavam se dedicando a dados sobre quase tudo.
- 00:16:42Mas apenas números não nos dizem nada.
- 00:16:46Você deve analisá-los, e é aí que entra a estatística.
- 00:16:55Quanto os primeiros estatísticos começaram a se familiarizar com
- 00:16:59a análise de seus dados
- 00:17:00eles adoraram a média, e tiravam média de tudo.
- 00:17:11O bom da média é que
- 00:17:13você pode pegar uma massa enorme de dados e reduzí-la a um único número.
- 00:17:21E ainda todos nós sejamos únicos, nossas vidas coletivas produzem
- 00:17:26médias que podem caracterizar populações inteiras.
- 00:17:34Na média, a rainha aponta 70 cavaleiros por ano... ...mas só 15 damas
- 00:17:41Eu olhei no meu jornal local e vi o caso de uma aposentada
- 00:17:45que pisou acidentalmente no acelerador
- 00:17:49e esmagou sua amiga contra uma parede.
- 00:17:52Uma coisa horrível, devastadora.
- 00:17:56E houve o segundo caso sobre um jovem que não tinha
- 00:18:01carteira de motorista, estava dirigindo drogado e alcoolizado,
- 00:18:07e ele atropelou e matou um pedestre.
- 00:18:10O que é notável, absolutamente notável, se você olhar pro número
- 00:18:15de pessoas que morrem todos ano em acidentes de trânsito, é praticamente constante.
- 00:18:22O quê?
- 00:18:24Todos esses eventos individuais, de alguma forma quando você soma tudo, tá o mesmo número todo ano.
- 00:18:31E todo ano, morrem duas vezes e meia mais homens
- 00:18:35que mulheres morrem em acidentes, e isso é constante.
- 00:18:38E todo ano o número na Bélgica é o dobro da Inglaterra.
- 00:18:44Essas são regularidades notáveis.
- 00:18:47Então esses eventos individuais se somam num fenômeno social.
- 00:18:56Vamos ver o que a Suécia fez.
- 00:18:58Costumávamos nos vangloriar do rápido progresso social, nós estávamos lá...
- 00:19:01Nas minhas palestras, para contar histórias sobre o mundo em mudança,
- 00:19:05Eu uso médias de países inteiros,
- 00:19:08seja a média de renda, mortalidade infantil, tamanho das famílias
- 00:19:12ou emissão de carbono.
- 00:19:13OK, temos aqui a Singapura. No ano em que nasci,
- 00:19:16a Singapura tinha o dobro da mortalidade infantil da Suécia, o país mais tropical do mundo,
- 00:19:20um pântano no Equador, e aqui vamos nós.
- 00:19:22Levou um tempo para eles conseguirem a independência,
- 00:19:25mas então eles começaram a crescer sua economia,
- 00:19:27e fizeram investimentos sociais, eliminaram a malária,
- 00:19:29eles têm um magnífico sistema de saúde que bateu os EUA e a Suécia.
- 00:19:33Nunca achamos que isso aconteceria, que eles iriam ganhar da Suécia!
- 00:19:40As médias são úteis, mas não contam a história toda.
- 00:19:48Na média, os suecos têm um pouco menos que duas pernas.
- 00:19:53Isso é porque algumas pessoas têm apenas uma perna, ou nenhuma,
- 00:19:57e ninguém tem três pernas.
- 00:19:59Então quase todos na Suécia têm mais do que a média de pernas.
- 00:20:06A variação nos dados é tão importante quanto a média.
- 00:20:16Mas como entender a variação?
- 00:20:19Para isso, você transforma os números em formas.
- 00:20:23Vamos olhar novamente para o número de mulheres adultas na Suécia
- 00:20:26de diferentes alturas.
- 00:20:27Ao plotar os dados como formas, vemos como as alturas
- 00:20:32variam da média e qual o tamanho dessa variação.
- 00:20:36O formato de um grupo de dados é chamado da sua distribuição.
- 00:20:41Essa é a distribuição de renda da China, em 1970.
- 00:20:46Essa é a distribuição de renda dos Estados Unidos, 1970.
- 00:20:51Quase não se encontram, e então o que aconteceu?
- 00:20:54A China está crescendo, já não é mais tão igualitária,
- 00:20:56e aparece aqui ameaçando os Estados Unidos.
- 00:21:01Não parece um fantasma?
- 00:21:03Assustador.
- 00:21:17Os primeiros estatísticos que exploraram a distribuição
- 00:21:21descobriram uma forma que parecia ser muito comum.
- 00:21:25O estudioso vitoriano Francis Galton
- 00:21:28estava tão fascinado que construiu uma máquina que conseguia reproduzir essa forma,
- 00:21:32e ele descobriu que ela descrevia tantos conjuntos de dados diferentes
- 00:21:36que ele a chamou de "distribuição normal".
- 00:21:38Seja tamanho de braços das pessoas, capacidade dos pulmões,
- 00:21:45ou até seus resultados em provas,
- 00:21:47a forma da distribuiçã normal aparece denovo e denovo.
- 00:21:51Outros estatísticos acharam outras formas regulares,
- 00:21:56cada uma produzira por tipos particulares de processos naturais ou sociais.
- 00:22:01E cada estatístico tem a sua favorita.
- 00:22:05A distribuição Poisson, a forma Poisson é a minha forma preferida.
- 00:22:09Ela é viciante.
- 00:22:15A forma Poisson descreve a chance de
- 00:22:18eventos fora do comum acontecerem.
- 00:22:21Imagine uma parada de ônibus em Londres, onde sabemos que em média
- 00:22:24passam três ônibus em uma hora.
- 00:22:26Não vamos ter sempre três ônibus, é claro.
- 00:22:29Incrivelmente, a forma Poisson nos mostra a probabilidade
- 00:22:33de, em qualquer hora, termos quatro cinco ou seis ônibus,
- 00:22:37ou ônibus nenhum.
- 00:22:40A forma exata muda com a média.
- 00:22:43Mas seja em quantas pessoas ganham a loteria
- 00:22:46a cada semana,
- 00:22:48ou quantas pessoas vão ligar para um call center a cada minuto,
- 00:22:51a forma Poisson vai dar as probabilidades.
- 00:22:57Um exemplo incrível disso foi aplicado no fim do século 19,
- 00:23:01a contagem anual de oficiais prussianos
- 00:23:04de cavalaria que eram pisoteados até a morte por seus cavalos.
- 00:23:07Em alguns anos não havia nenhum, outros apenas um,
- 00:23:10alguns anos haviam dois, até sete, imagino que tenha sido um ano ruim.
- 00:23:13Mas com essa distribuição, indepentende dos anos em que haviam
- 00:23:16nenhum, um, dois, três, quatro oficiais de cavalaria prussianos
- 00:23:19mortos por seus cavalos, obedecia lindamente a distribuição Poisson.
- 00:23:42Então os estatísticos usam formas para revelar os padrões nos dados.
- 00:23:48Mas também usamos imagens de todos os tipos
- 00:23:51para comunicar estatísticas ao público em geral.
- 00:23:54Porque se a história nos números
- 00:23:57é contada de uma maneira bonita e inteligente, então todos entendem.
- 00:24:02Dos pioneiros dos gráficos estatísticos, a minha favorita é a Florence Nightingale.
- 00:24:17Um dos 20.389 livros na Biblioteca Britãnica com 'estatística' no título
- 00:24:24Poucas pessoas sabem que ela era conhecida
- 00:24:27como uma estatística apaixonada, e não apenas como a Dama da Lâmpada.
- 00:24:30Ela disse que "para endender o pensamento de Deus, deve-se estudar estatística,
- 00:24:34"pois ela é a medida de Seu propósito".
- 00:24:37As estatisticas para ela eram um dever religioso, e imperativo moral.
- 00:24:42Quanto Florence tinha nove anos quando começou a coletar dados.
- 00:24:45Seus dados eram diferentes frutas e vegetais que ela achava.
- 00:24:48Os colocava em tabelas diferentes.
- 00:24:50Tentando organizá-los de uma forma padrão.
- 00:24:52Temos aqui uma das primeiras tabelas estatística de Nightingale
- 00:24:55aos nove anos de idade.
- 00:25:04Em meados dos anos 1850, Florence Nightingale foi para a Criméia tratar das baixas de guerra britânicas.
- 00:25:11Ela ficou horrorizada pelo que descobriu.
- 00:25:14Por todo soldado caído em combate, haviam muitos, muitos mais
- 00:25:19morrendo por doenças que pegavam nos imundos hospitais do exército.
- 00:25:25Então Florence Nightingale começou a contar os mortos.
- 00:25:29Por dois anos ela logou dados de mortalidade de maneira meticulosa.
- 00:25:34Quando a guerra acabou ela persuadiu o governo a implantar a
- 00:25:39Comissão Real de Inquérito,
- 00:25:41e apresentou seus dados em um relatório devastador.
- 00:25:44O que garantiu seu lugar nos livros de história estatística
- 00:25:48são os gráficos que ela usou.
- 00:25:50E um em particupar, o gráfico de área polar.
- 00:25:53Para cada mês da guerra, a enorme parcela azul representava
- 00:25:58os soldados mortos por doenças preveníveis.
- 00:26:01A muito menor parcela azul eram mortes por ferimentos,
- 00:26:05e as parcelas pretas eram mortes por acidentes e outras causas.
- 00:26:11Os gráficos da Nightingale eram tão claros que foram impossíveis de ignorar.
- 00:26:17O comum na época de Nightingale
- 00:26:19era produzir tabelas e tabelas com números - uma coisa absolutamente tediosa que,
- 00:26:23a menos que você fosse um estatístico absolutamente dedicado,
- 00:26:26era muito difícil de visualizar padrões naturamente.
- 00:26:29Mas as visualizações contam uma história, e a contam imediatamente.
- 00:26:33E o uso de cor e forma podem realmente contar uma história poderosa.
- 00:26:38E hoje em dia, naturalmente, podemos também fazer as coisas se moverem.
- 00:26:41Florence Nightingale teria adorado poder brincar com isso...
- 00:26:44Ela teria produzido animações incríveis, tenho certeza disso.
- 00:26:50Hoje, 150 anos depois, os gráficos de Nightingale
- 00:26:54são considerados um clássico.
- 00:26:57Eles levaram a uma revolução em enfermagem, tratamento
- 00:27:00e higiene em hospitais no mundo todo, salvando incontáveis vidas.
- 00:27:07E os gráficos estatísticos se tornaram uma forma de arte própria,
- 00:27:11liderados por designers apaixonados por visualização de dados.
- 00:27:19Tem uma chace de 1 em 207 de morrer devido a um erro médico
- 00:27:24Esse é o Bilhão de Librômetro.
- 00:27:26Essa imagem surgiu da frustração
- 00:27:29com as notícias dos bilhões de libras na mídia.
- 00:27:32£500 bilhões pra essa guerra.
- 00:27:34£50 bilhões pra um derramamento de óleo.
- 00:27:36Não faz sentido - os números são grandes demais para a nossa mente compreender.
- 00:27:39Então em peguei todos esses dados de inúmeras fontes de notícias e criei esse diagrama.
- 00:27:43Os quadrados aqui estão em escala de acordo com as quantias de bilhões de libras.
- 00:27:48Quando você vê os números visualizados assim,
- 00:27:51começa a ter um relacionamento diferente com eles.
- 00:27:54Você começa a ver os padrões e escalas deles.
- 00:27:57Aqui no canto, esse quadradinho - £37 bilhões.
- 00:27:59Esse foi o custo previsto para a guerra do Iraque em 2003.
- 00:28:02Como você pode ver, ele cresceu exponencialmente nos últimos anos.
- 00:28:06e o custo total está hoje em torno de £2.500 Bilhões.
- 00:28:10É engraçado porque quando você visualiza as estatísticas
- 00:28:13você as entende, e quando você as entende,
- 00:28:15você pode de fato começar a colocar as coisas em perspectiva.
- 00:28:23A visualização está bem no centro do meu trabalho também.
- 00:28:27Eu ensino saúde global.
- 00:28:30E eu sei que ter os dados não basta -
- 00:28:33Eu preciso mostrá-los de maneiras que as pessoas gostem e entendam.
- 00:28:39Agora eu vou tentar algo que nunca fiz antes.
- 00:28:42Animação dos dados no espaço real,
- 00:28:45com um pouco de ajuda técnica da equipe.
- 00:28:50Vamos lá.
- 00:28:52Primeiro, um eixo para saúde.
- 00:28:54Expectativa de vida de 25 a 75 anos.
- 00:28:58E aqui embaixo um eixo para riqueza.
- 00:29:01Renda por pessoa - 400, 4,000, 40,000.
- 00:29:06Então aqui embaixo temos pobres e doentes.
- 00:29:10Aqui em cima estão ricos e saudáveis.
- 00:29:14Agora vou mostrar o mundo
- 00:29:18200 anos atrás, em 1810.
- 00:29:21Aqui estão todos os países.
- 00:29:22Europa, marrom; Asia, vermelho; Oriente Médio, verde;
- 00:29:26África ao Sul do Saara, azul; e as Américas, amarelo.
- 00:29:29e o tamanho da bolha do país mostra o tamanho da população.
- 00:29:33Em 1810 estava bastante cheio aqui embaixo, não é?
- 00:29:37Todos os países eram pobres e doentes.
- 00:29:39A Expectativa de vida era abaixo de 40 em todos os países.
- 00:29:43Apenas Reino Unido e Holanda estavam um pouco melhores. Mas não muito.
- 00:29:48E agora vou avançar o mundo.
- 00:29:52A revolução industrial faz com que países na Europa e outros lugares
- 00:29:56se distanciem dos demais.
- 00:29:59Mas os países colonizados na Asia e África
- 00:30:02continuam presos lá embaixo.
- 00:30:04E eventualmente os países ocidentais vai ficando cada vez mais saudáveis.
- 00:30:08E agora vamos diminuir para mostrar o impacto da Primeira Guerra Mundial
- 00:30:13e da epidemia da Gripe Espanhola.
- 00:30:15Que catástrofe!
- 00:30:18E agora aceleramos pelos anos 1920 e 1930 e,
- 00:30:22apesar da Grande Depressão,
- 00:30:24países ocidentais continuam a ir para maior riquesa e saúde.
- 00:30:27Japão e outros tentam seguir.
- 00:30:30Mas a maioria deles fica aqui embaixo.
- 00:30:32E depois das tragédias da Segunda Guerra Mundial,
- 00:30:35paramos um pouco para olhar o mundo em 1948.
- 00:30:391948 foi um ótimo ano.
- 00:30:42A guerra tinha acabado,
- 00:30:43A Suécia ficou no topo do quadro de medalhas das Olimpíadas de Inverno e eu nasci.
- 00:30:48Mas as diferenças entre os países do mundo
- 00:30:51estava maior que nunca.
- 00:30:52Os Estados Unidos estavam na frente.
- 00:30:54O Japão estava melhorando.
- 00:30:56O Brasil estava bem atrás,
- 00:30:58O Irã estava ficando um pouco mais rico com o petróleo mas ainda tinha vidas curtas.
- 00:31:03E os gigantes asiáticos...
- 00:31:05China, Índia, Paquistão, Bangladesh e Indonésia,
- 00:31:08ainda estavam pobres e doentes lá embaixo.
- 00:31:11Mas olhe o que está prestes a acontecer! Lá vamos nós denovo.
- 00:31:14Durante a minha vida, antigas colônias ganharam independência e então finalmente
- 00:31:18começaram a ficar mais e mais saudáveis, e mais e mais ricas.
- 00:31:22E nos anos 1970, países na Ásia e América Latina
- 00:31:26começaram a se aproximar dos países ricos.
- 00:31:28Eles se tornaram as economias emergentes.
- 00:31:31Alguns na África avançaram,
- 00:31:32outros africanos ficaram presos por guerras civis, outros afetados pelo HIV.
- 00:31:37E agora vemos o mundo com as estatísticas mais atualizadas.
- 00:31:42A maior parte das pessoas hoje vive no meio.
- 00:31:45Mas já uma imensa diferença
- 00:31:48entre os melhores e piores países.
- 00:31:51Também existem enormes desigualdades entro dos países.
- 00:31:55As bolhas mostram as médias dos países, mas eu posso dividí-las.
- 00:31:59Pegue a China. Eu posso dividí-la entre províncias.
- 00:32:02Lá vai Xangai...
- 00:32:05Ela tem a mesma riquesa e saúde da Itália hoje.
- 00:32:08E lá vai a pobre província interiorana de Guizhou,
- 00:32:11ela é como o Paquistão.
- 00:32:12E se eu dividir mais ainda, as partes rurais são como Gana na África.
- 00:32:19Ainda assim, apesar das enormes disparidades atuais,
- 00:32:23nós tivemos 200 anos de progresso incrível!
- 00:32:27A enorme diferença histórica entre ocidente e o resto está se fechando.
- 00:32:31Nós nos tornamos um mundo totalmente novo, convergente.
- 00:32:35E eu vejo um claro padrão par ao futuro.
- 00:32:38Com assistência, comércio, tecnologias verdes e paz,
- 00:32:41é plenamente possível que todos possam chegar
- 00:32:43ao canto rico e saudável.
- 00:32:48Bom, o que vocês viram nos ultimos minutos
- 00:32:51é uma história de 200 países mostrada em 200 anos e além.
- 00:32:56Envolveu a plotagem de 120.000 números.
- 00:33:00Bacana, né?
- 00:33:07Então, com as estatísticas, podemos começar a ver as coisas como elas realmente são.
- 00:33:13De tabelas com dados a médias, distribuições e visualizações,
- 00:33:18as estatísticas nos deram uma visão clara do mundo.
- 00:33:22Mas, com estatísticas, podemos não somente descobrir O QUE está acontecendo
- 00:33:28mas também explorar PORQUE
- 00:33:30ao usar um método analítico poderoso - correlação.
- 00:33:35Olhar pra apenas uma coisa de cada vez não nos diz muita coisa.
- 00:33:38Temos que olhar para o relacionamento entre as coisas,
- 00:33:41como elas mudam, como elas variam juntas.
- 00:33:43É assim que age a correlação.
- 00:33:45É assim que começamos a tentar entender os processos
- 00:33:48que realmente acontecem no mundo e na sociedade.
- 00:33:52A maioria hoje reconhece que crime se correlaciona com pobreza,
- 00:33:57que infecção se correlaciona com saneamento ruim,
- 00:33:59e que conhecimento de estatística se correlaciona
- 00:34:02com ser bom de dança!
- 00:34:06As correlações podem ser complicadas.
- 00:34:10Eu recebi uma piada sobre correlações bobas.
- 00:34:12Um americano tinha medo de ataque do coração.
- 00:34:15Ele descobriu que os japoneses comem pouquíssima gordura
- 00:34:19e quase não bebem vinho,
- 00:34:22mas tinham muito menos ataques cardíacos que os americanos.
- 00:34:25Mas, por outro lado, ele também descobriu que os franceses
- 00:34:28comem tanta gordura quanto os americanos, e bebem muito mais vinho, mas têm menos ataques cardíacos.
- 00:34:35Então ele concluiu que o que mata é falar inglês.
- 00:34:40# Fume, fume fume esse cigarro,
- 00:34:43# Trague, trague, trague, e se você fumar até a morte... #
- 00:34:48O tempo, o ritmo, o cigarro. Weights Tilt.
- 00:34:51O melhor exemplo de uma correlação inovadora
- 00:34:56é a ligação que foi estabelecida nos anos 1950 entre o fumo e câncer de pulmão.
- 00:35:01Pouco após o fim da Segunda Guerra Mundial, um médico britânico, Richard Doll,
- 00:35:07invetigou pacientes de câncer de pulmão em 20 hospitais de Londres.
- 00:35:11E ele ficou convencido que a única coisa que eles tinham em comum era o fumo.
- 00:35:15Teve tanta certeza que parou de fumar.
- 00:35:18Mas outras pessoas não tinham tanta certeza.
- 00:35:22Grande parte da discussão sobre os dados iniciais
- 00:35:25ligando fumo com câncer, dizia "Certamente não é o fumo,
- 00:35:29"isso que fizemos a vida toda, isso não deve fazer mal
- 00:35:32"Talvez sejam os genes.
- 00:35:35"Talvez pessoas que são pré-dispostas geneticamente para ter câncer de pulmão
- 00:35:39"também são pré-dispostas geneticamente a fumar."
- 00:35:43"Talvez não seja o cigarro, e sim a poluição do ar -
- 00:35:47"fumantes de alguma são mais expostos a poluição do ar que os não fumantes.
- 00:35:52"Talvez não seja o cigarro, e sim a pobreza."
- 00:35:56Então agora temso três explicações alternativas, ao além do simples azar.
- 00:36:02Para verificar a sua correlação implicava causa e efeito,
- 00:36:06Richard Doll criou o maior estudo estatístico sobre o fumo até então.
- 00:36:10Ele começou a seguir a vida de 40.000 médicos britânicos,
- 00:36:14alguns dos quais fumavam e outros não,
- 00:36:17e juntou dados suficientes
- 00:36:19para correlacionar a quantidade de médicos que fumavam
- 00:36:22com suas possibilidades de pegar câncer.
- 00:36:24Eventualmente, ele mostrou não só uma correlação entre o fumo e o câncer de pulmão,
- 00:36:30mas também uma correlação entre parar de fumar e a redução do risco.
- 00:36:35Isso era a ciência em seu melhor.
- 00:36:39O que as correlações não substituem é o pensamento humano.
- 00:36:44Você tem que pensar sobre o que aquilo significa.
- 00:36:46O que um bom cientista faz, se ele chega a uma correlação,
- 00:36:51é tentar refutá-la o quanto for possível,
- 00:36:55tentar desconstruí-la, se livrar dela, tentar contestá-la.
- 00:37:00Se ela aguentar todos esses esforços para destruí-la
- 00:37:05e ainda estiver de pé, então, cautelosamente, você diz: "Podemos mesmo ter algo aqui"
- 00:37:26Por mais brilhante que seja o cientista, os dados ainda são o oxigênio da ciência.
- 00:37:32A boa notícia é que com mais dados, vamos achar mais correlações, testaremos mais teorias,
- 00:37:39e mais descobertas serão possíveis.
- 00:37:46E a história mostra como nossa soma total de informação cresce em muito ao desenvolvemos novas tecnologias.
- 00:37:53A invenção da prensa móvel iniciou a primeira explosão de dados e informações.
- 00:38:00Se você empilhar todos os livros que foram impressos até o ano 1700,
- 00:38:06teríamos 60 pilhas, cada uma com a altura do Monte Evetest.
- 00:38:12Então, começando no século 19,
- 00:38:15veio a segunda revolução da informação com o telégrafo,
- 00:38:19gramofone e câmera. E depois, rádio e TV.
- 00:38:23A quantia total de informações explodiu.
- 00:38:28E nos anos 1950 a informação disponível a todos nós tinha se multiplicado 6000 vezes.
- 00:38:35Então, graças ao computador e mais tarde à internet, ficamos digitais.
- 00:38:41E a quantia de dados que temos agora é inimaginavelmente vasta.
- 00:38:49Uma única letra impressa em um livro é equivalente a um byte de dados.
- 00:38:55Uma página impressa equivale a um ou dois kilobytes.
- 00:39:01Cinco megabytes são suficientes para toda a obra de Shakespeare.
- 00:39:0810 gigabytes - isso é um filme em DVD.
- 00:39:16Dois terabytes são as dezenas de milhões de fotos adicionadas ao Facebook todo dia.
- 00:39:24Dez petabytes é a quantia de dados gerada a cada segundo pelo maior acelerador de partículas do mundo.
- 00:39:32É tanto que só uma pequena fração é gravada.
- 00:39:35Seis exabytes é o que você teria se sequenciasse os genomas de todas as pessoas do planeta.
- 00:39:48Mas na verdade, isso não é nada.
- 00:39:50Em 2009, a internet somava até 500 exabytes.
- 00:39:55Em 2010, em apenas um ano, isso vai dobrar pra mais de um zetabyte!
- 00:40:06De volta ao mundo real, se transformássemos todos esses dados em livros, isso daria 90 pilhas de livros,
- 00:40:14cada uma indo daqui até o Sol!
- 00:40:18O dilúvo de dados é desconcertante, mas com os computadores atuais,
- 00:40:23e com a estatística, tenho confiança de que podemos lidar com isso.
- 00:40:27Na questão dos dados de toda a internet,
- 00:40:31a potência de análise estatística
- 00:40:34é o gigante do Vale do Silício, Google.
- 00:40:40São feitas 1 bilhão de buscas no Google todo dia
- 00:40:44Uma pessoa comum em sua vida toda é exposta a mais ou menos 100 milhões de palavras em conversas.
- 00:40:50E se você multiplicar isso pelas 6 bilhões de pessoas no planeta,
- 00:40:54essa quantia de palavras é parecida com o número de palavras
- 00:40:58que a Google tem disponível a qualquer momento.
- 00:41:03os computadores da Google rastreiam e arquivam cada palavra, página e imagem que conseguem encontrar.
- 00:41:08Então eles caçam por padrões e correlações nesses dados,
- 00:41:14fazendo estatística em uma escala gigantesca.
- 00:41:17E, pra mim, eles têm um projeto que é particularmente animador - tradução linguística estatística.
- 00:41:25Queríamos garantir acesso a todas as informações na web, independente da língua falada.
- 00:41:30Existe tanta informação na internet,
- 00:41:33que seria completamente impossível traduzir tudo manualmente em todas as línguas possíveis.
- 00:41:37Decidimos que teríamos que conseguir fazer tradução automática.
- 00:41:44No passado, os programadores tentavam ensinar seus computadores
- 00:41:47a ver cada língua como um grupo de regras gramáticas - da mesma forma que línguas são ensinadas nas escola.
- 00:41:53Mas isso não funcionou porque nenhum conjunto de regras consegue encapsular uma língua,
- 00:41:58com todas suas sutilezas e ambiguidades.
- 00:42:01"Tendo comido nosso almoço, o ônibus partiu".
- 00:42:05Bom, isso está obviamente incorreto.
- 00:42:07Escrito assim, faz acreditar que o ônibus comeu o almoço.
- 00:42:12Seria muito melhor dizer...
- 00:42:15"tendo comido nosso almoço, nós partimos no ônibus".
- 00:42:19Essas regras são úteis e ajudam na maioria das vezes, mas nem sempre são verdade.
- 00:42:26E a idéia de usar tradução estatística automática é dizer,
- 00:42:30"Se você tem todas essas exceções, talvez dê pra trabalhar sem usar regra alguma
- 00:42:35"Talvez você possa tratar tudo como excessão." E é exatamente isso que fizemos.
- 00:42:44Fala 3 de uma estimativa de 7.358 línguas existentes
- 00:42:48O que o computador está fazendo quando está aprendendo a traduzir
- 00:42:52é aprender as correlações entre palavras
- 00:42:55e correlações entre frases.
- 00:42:57Então nós alimentamos o sistema com enormes quantias de dados
- 00:43:00e então o sistema vê uma determinada palavra ou frase
- 00:43:04se correlaciona com frequência a outra língua.
- 00:43:09O site da Google oferece atualmente tradução entre 57 línguas diferentes.
- 00:43:15E faz isso de forma puramente estatística, tendo correlacionado uma enorme coleção de textos multilíngues.
- 00:43:22As pessoas que construíram o sistema não precisaram aprender chinês
- 00:43:25para construir o sistema de chinês-para-inglês, assim como não precisaram saber árabe.
- 00:43:29O conhecimento necessário é basicamente conhecimento de estatística,
- 00:43:33conhecimento de ciência da computação e conhecimento de infraestrutura
- 00:43:35para construir os enormes sistemas computacionais que estamos construindo para fazer isso.
- 00:43:42Eu me conectei com a Google do meu escritório em Estocolmo para tentar o tradutor por conta própria.
- 00:43:48'Eu vou digitar algumas sentenças em sueco.'
- 00:43:51OK.
- 00:44:00OK. Ele está dizendo, "O ministro de finanças da Suécia tem um rabo de cavalo e um brinco de ouro na sua orelha."
- 00:44:07Imagino que signifique na orelha dele. 'Correto, isso é incrível!'
- 00:44:11'Ele vem do partido Conservador, esse é o tipo de Suécia que temos hoje'
- 00:44:15'Vou digitar mais uma sentença.'
- 00:44:28"Em seu relacionamento de mesmo sexo tem o novo bispo de Estocolmo e seus parceiros um filho de três anos."
- 00:44:35Está quase perfeito, tem uma coisa importante -
- 00:44:38é DELA, é um relacionamento lésbico.
- 00:44:41Ok, então esses tipos de palavras, dele ou dela são um dos desafios
- 00:44:46na tradução pra acertar realmente.
- 00:44:49Especialmente quando estamos falando de bispas, temos que dar um desconto!
- 00:44:51'Certo, certo.'
- 00:44:53Eu acho que é uma palavra que é entendida com mais frequência como "ele". 'Vou escrever mais uma sentença.'
- 00:45:06OK. "Quando a Suécia participa no Olímpico, objetivo não é vencer, mas vencer a Noruega."
- 00:45:11'Sim! É isso que diz!'
- 00:45:13'Mas eles são muito bons nas Olimpíadas de Inverno, então não conseguimos, mas estamos tentando.'
- 00:45:17Ah, muito bom, muito bom.
- 00:45:19'Isso é incrível, e fiquei especialmente impressionado'
- 00:45:24'que ele tenha reconhecido palavras como "relacionamento de mesmo sexo", que são muito novas na língua.'
- 00:45:30'O tradutor é bom, mas se eles conseguirem fazer o que vem a seguir, vai ser fantástico.'
- 00:45:36Uma das possibilidades animadoras
- 00:45:38é a combinação de tradução automática com a tecnologia de reconhecimento de fala.
- 00:45:42Ambas são de natureza estatística.
- 00:45:45A tradução automática depende de estatísticas para mapear uma linguagem à outra,
- 00:45:51e o reconhecimento de fala depende das estatísticas para mapear da forma sonora para palavras.
- 00:45:57Quanto as colocamos juntas,
- 00:45:59então temos a capacidade de ter conversas instantâneas
- 00:46:03entre duas pessoas que não falam uma língua em comum.
- 00:46:06Eu posso falar com você na minha língua,
- 00:46:08você me escuta na sua língua e me responde de volta.
- 00:46:11E em tempo real podemos fazer essa tradução,
- 00:46:15podemos trazer duas pessoas e permitir que elas conversem.
- 00:46:31A internet é só uma dessas muitas tecnologias criadas para coletar quantidades imensas de dados.
- 00:46:39Cientistas estudando a Terra e o nosso meio ambiente
- 00:46:43hoje usam uma gama incrível de instrumentos
- 00:46:47para medir os processos do nosso planeta.
- 00:46:52À nossa volta, sensores medem continuamente temperatura, fluxo das águas e correntes oceânicas.
- 00:46:59E em órbita, estão satélites ocupados em fotografar formações de nuvens, crescimento de florestas e geleiras.
- 00:47:06Os cientistas falam em "instrumentalizar a Terra".
- 00:47:13E apontando para os céus estão novos e poderosos telescópios, mapeando o universo.
- 00:47:30O que está acontecendo na astronomia é típico de como essa torrente de dados
- 00:47:34está transformando a ciência.
- 00:47:39Astrônomos estão agora respondendo mistérios persistentes do cosmos
- 00:47:45ao aplicarem métodos estatísticos a esses novos dados.
- 00:47:54Vive em uma galáxia com mais de 200.000.000.000 de estrelas
- 00:47:59A galáxia é um lugar muito grande e contém bilhões de estrelas,
- 00:48:03então para juntar um quadro coerente da galáxia inteira demanda uma quantia enorme de dados.
- 00:48:09E antes que pudéssemos fazer uma pesquisa dos céus com sensores digitais,
- 00:48:13o que significa mapear muitas, muitas estrelas de uma vez,
- 00:48:16era muito difícil coletar dados suficientes sobre a galáxia.
- 00:48:24No passado, grandes pesquisas do céu noturno tinham que ser feitas
- 00:48:28com a esposição de milhares de enormes placas fotográficas.
- 00:48:32Mas essas pesquisas podiam demorar 25 anos ou mais.
- 00:48:39Então, nos anos 1990, veio a astronomia digital, e um enorme aumento
- 00:48:44tanto da quantidade, quanto da acessibilidade dos dados.
- 00:48:49A Sloan Sky Survey é a maior pesquisa desse tipo até hoje, usando um imenso sensor digital
- 00:48:55montado em um telescópio no Novo México.
- 00:49:00Ele escaneou o céu noturno todas as noites por oito anos,
- 00:49:05criando uma imagem composta com resolução sem precedentes.
- 00:49:09A Sloan é uma das melhores e mais profundas pesquisas de dados que temos na astronomia.
- 00:49:14Tanto da nossa galáxia, quanto de outras mais distantes de nós.
- 00:49:24Todos os dados da Sloan estão na internet,
- 00:49:27e com eles, os astrônomos identificaram milhões de estrelas e galáxias até então desconhecidas.
- 00:49:34Eles também varrem a base de dados por padrões estatísticos
- 00:49:37que irão provar, refutar, ou até sugerir novas teorias.
- 00:49:42Temos uma idéia de como as galáxias crescem, como elas se tornam enormes como a em que vivemos, a Via Láctea,
- 00:49:49não é de uma só vez, ou ordenadamente, mas ao incorporar continuamente,
- 00:49:55basicamente canibalizando galáxias menores.
- 00:49:59Elas as dissolvem e se tornam parte da galáxia maior, que vai crescendo.
- 00:50:06É uma idéia incrível, e nos dados da Sloan, temos evidências disso.
- 00:50:12Grupos de estrelas que vieram de galáxias canibalizadas
- 00:50:16se sobressaem nos dados da Sloan como sendo estatísticamente diferentes de outras estrelas,
- 00:50:21porque elas se movem com velocidades diferentes.
- 00:50:24Cada pico nesses gráficos de distribuição
- 00:50:28significa que a Professora Rockosi achou um grupo de estrelas viajando de maneira diferente das outras.
- 00:50:35Esses são os padrões chave que ela está procurando.
- 00:50:40As evidências aumentam para o fato de que realmente é dessa forma que as galáxias crescem,
- 00:50:44ou pelo menos, uma das principais formas de como isso acontece.
- 00:50:47E isso é uma parte importante no entendimento de como as galáxias nascem, não só a nossa, mas todas.
- 00:50:56Quanto maior a quantidade de dados, mais descobertas podem ser feitas.
- 00:51:00E a tecnologia está melhorando o tempo todo.
- 00:51:04O próximo grande telescópio de pesquisa começará a funcionar em 2015.
- 00:51:07Ele vai deixar a Sloan comendo poeira!
- 00:51:10A Sloan demorou oito anos para cobrir um quarto do céu noturno.
- 00:51:17O novo telescópio vai escanear o céu inteiro, em resolução maior ainda, a cada três dias!
- 00:51:34As vastas quantidades de dados que temos hoje permitem que pesquisadores de diversas áreas
- 00:51:41testem suas teorias em uma escala que antes era inimaginável.
- 00:51:46Mas ainda, pode um dia mudar fundamentalmente a forma de se fazer ciência.
- 00:51:53Com o poder dos computadores modernos aplicado a esses dados todos,
- 00:51:58as máquinas podem ser capazes de guiar os pesquisadores.
- 00:52:07Cada célula de seu corpo tem 2 metros de DNA (20 bilhões de Km no total)
- 00:52:14Estamos em um ponto profundamente importante,
- 00:52:17potencialmente um dos mais significativos da ciência.
- 00:52:22E certamente um dos mais animadores,
- 00:52:24onde o potencial de transformar não só como os cientistas fazem a ciência, mas até o que é possível com a ciência.
- 00:52:32E o que vai impulsionar essa transformação
- 00:52:34de como ela e feita, e o que é possível fazer com ela
- 00:52:38vai ser a computação.
- 00:52:41Muitas das dinâmicas do mundo natural, como a interação das florestas com a atmosfera,
- 00:52:49são tão complexas que não as entendemos de fato.
- 00:52:53Mas agora os computadores estão gerando literalmente dezenas de milhares de simulações diferentes
- 00:52:59de como esses sistemas biológicos funcionam.
- 00:53:03É como se criasse milhares de mundos paralelos hipotéticos.
- 00:53:07E cada uma dessas simulações
- 00:53:10é analisada estatísticamente para ver se correspondem com o que é observado na natureza.
- 00:53:18Os computadores agora podem gerar e testar hipóteses
- 00:53:21automaticamente, sem quase nenhuma interação humana
- 00:53:28Essa nova aplicação das estatísticas se tornará absolutamente vital para o futuro da ciência.
- 00:53:35Está criando um novo paradigma
- 00:53:39na ciência, no modo em que fazemos a ciência.
- 00:53:42que é cada vez mais...
- 00:53:45Que poderíamos classificar como... dirigida por dados, ou centrada em dados
- 00:53:50ao invés de centrada em hipóteses ou experimentos.
- 00:53:55Então, são tempos emocionantes em termos da ciência,
- 00:53:58em termos da computação e em termos da estatística.
- 00:54:08Mas se isso soa um pouco abstrato e teórico para você, que tal uma fronteira final?
- 00:54:15Poderia a estatística dar sentido aos nossos sentimentos?
- 00:54:21Na California - onde mais? - um cientista da computação
- 00:54:25está vasculhando a internet para tentar encontrar os padrões dos nossos pensamentos e emoções.
- 00:54:36Se sente feliz 78% do tempo
- 00:54:44Esse é o movimento da loucura.
- 00:54:46O movimento da loucura representa o mundo visto de longe.
- 00:54:50Cada um desses pontos coloridos é um sentimento individual
- 00:54:54expressado por alguém em um blog ou um tweet.
- 00:54:58Quando você clica no ponto ele explode para revelar o sentimento daquela pessoa.
- 00:55:04Isso é o que as pessoas estão dizendo de como se sentem hoje.
- 00:55:07Melhor... segura...
- 00:55:10uma droga...
- 00:55:12bem...
- 00:55:14bonita... especial...
- 00:55:17triste... sozinho...
- 00:55:25Então, a cada minuto, o We Feel Fine varre os blogs do mundo,
- 00:55:29pega todas as sentenças que começam com "estou" ou "me sinto",
- 00:55:34e as coloca num banco de dados.
- 00:55:35Coletamos esses sentimentos e contamos os mais comuns.
- 00:55:40Eles são melhor... mal...
- 00:55:43bem... certo...
- 00:55:45culpado... doente...
- 00:55:48igual... uma merda...
- 00:55:51triste... bom...
- 00:55:54e assim por diante.
- 00:55:58E podemos pegar qualquer sentimento e analizá-lo.
- 00:56:01No momento muitas pessoas estão felizes.
- 00:56:04Podemos olhar para todas as pessoas que estão felizes e dividí-las em idade, sexo ou localização.
- 00:56:10Como os eles têm perfis públicos, temos essa informação, então podemos fazer perguntas como,
- 00:56:16"As mulheres são mais felizes que os homens" ou, "A Inglaterra é mais feliz que os Estados Unidos?"
- 00:56:30Descobrimos que, à medida que as pessoas envelhecem, ficam mais felizes.
- 00:56:33E, além disso, vimos que pessoas mais jovens associam felicidade mais com excitação,
- 00:56:40e à medida que as pessoas envelhecem, associam felicidade mais com tranquilidade.
- 00:56:51Também vimos que as mulheres se sentem amadas mais que os homens, mas também mais culpadas.
- 00:56:57Enquanto os homens se sentem bem mais que as mulhares, mas também mais sozinhos.
- 00:57:06À medida que as pessoas vivem mais de suas vidas online, elas deixam para trás traços digitais,
- 00:57:12e esses traços podem começar a analizar estatísticamente o que significa ser um humano.
- 00:57:51Então, onde isso tudo nos leva?
- 00:57:54Geramos quantidades inimagináveis de dados sobre tudo que pudermos pensar.
- 00:58:00Analizamos para revelar os padrões.
- 00:58:02E agora, não só os experts, mas qualquer um de nós pode entender as histórias contidas nesses números.
- 00:58:18Ao invés de nos perdemos por preconceito,
- 00:58:21com as estatísticas às nossas mãos, nossos olhos podem se abrir para uma visão do mundo baseada em fatos.
- 00:58:28Então, mais do que nunca, podemos nos tornar autores do nosso próprio destino.
- 00:58:33E isso é bem emocionante, não é?!
- 00:58:37# 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20
- 00:58:44# 1, 22, 3, 24, 25, 26, 27, 28, 9, 30, 31, 32, 3, 34, 35, 36, 7
- 00:58:50# 38, 39, 40, 41, 42, 3, 44, 45, 46, 47
- 00:58:54*letra fica incompreensível*
- 00:59:08*letra vira barulho*
- 00:59:13# 100. #
- estatísticas
- dados
- ciência
- comunicação
- visualização
- saúde global
- responsabilização
- análise
- correlações
- comportamento social