Teorema Central do Limite - captando a lei natural da aleatoridade

00:36:01
https://www.youtube.com/watch?v=VeiNxBdwd2Q

Ringkasan

TLDRO vídeo explora a Lei das Médias e o Teorema Central do Limite por meio de simulações com lançamentos de moedas e dados. Aborda como a média amostral converge para a média populacional e como distribuições normais emergem com o aumento do tamanho da amostra. O experimento mostra que, conforme o número de lançamentos aumenta, a porcentagem de resultados se aproxima de 50%, validando a regra das grandes quantidades. A normalidade das distribuições amostrais é exemplificada e métodos estatísticos são aplicados utilizando o software R, destacando o significado do erro padrão e sua aplicação em intervalos de confiança.

Takeaways

  • 🎲 Lançamentos de moedas têm 50% de chance de cada resultado.
  • 📊 A média amostral se aproxima da média populacional com grandes n.
  • 📈 O tamanho da amostra impacta a normalidade da distribuição.
  • 🔍 O erro padrão é crucial na inferência estatística.
  • 📉 Distribuições de médias amostrais se tornam mais estreitas com amostras grandes.
  • 📉 A média das médias converge para o mi da população.
  • 📈 Histogramas ajudam a visualizar a normalidade das distribuição.
  • 🔄 O Teorema Central do Limite justifica a normalidade de médias amostrais.
  • �� O R é uma ferramenta poderosa para simulações estatísticas.
  • 📏 Intervalos de confiança ajudam a estimar a precisão de valores populacionais.

Garis waktu

  • 00:00:00 - 00:05:00

    O vídeo introduz o conceito de lançamentos de moedas e como calcular a média e o desvio padrão populacional, destacando que, ao realizar 1000 lançamentos, a porcentagem de caras se aproxima de 50%.

  • 00:05:00 - 00:10:00

    Com 1000 lançamentos, é feito um gráfico acumulativo que mostra a porcentagem de caras, demonstrando a Lei das Médias, onde, à medida que o número de lançamentos aumenta, a média amostral se aproxima da média populacional.

  • 00:10:00 - 00:15:00

    O exemplo de moedas é repetido usando dados, explicando a média e o desvio padrão dessas amostras, com o desvio padrão das médias diminuindo à medida que o tamanho das amostras aumenta.

  • 00:15:00 - 00:20:00

    Histograma das distribuições de médias de amostras é apresentado, mostrando que quanto maior o tamanho da amostra, mais centrada se torna a distribuição das médias em relação à média populacional.

  • 00:20:00 - 00:25:00

    Explora a normalidade das distribuições de médias à medida que o tamanho das amostras aumenta, evidenciando a aproximação à distribuição normal, mesmo a partir de distribuições não normais.

  • 00:25:00 - 00:30:00

    O Teorema Central do Limite é discutido, que afirma que, com amostras grandes, a distribuição das médias amostrais se torna normal, independentemente da distribuição da população original.

  • 00:30:00 - 00:36:01

    Por fim, é apresentado como calcular intervalos de confiança utilizando a média das amostras e seu desvio padrão, concluindo que quanto maior a amostra, mais precisas se tornam as estimativas sobre a população.

Tampilkan lebih banyak

Peta Pikiran

Video Tanya Jawab

  • O que é a Lei das Médias?

    A Lei das Médias afirma que à medida que o tamanho da amostra aumenta, a média amostral se aproxima da média populacional.

  • Como a normalidade da distribuição é alcançada?

    Com o aumento do tamanho da amostra, as distribuições de médias amostrais tendem a se tornar mais normais.

  • O que é o Teorema Central do Limite?

    É um princípio que afirma que a distribuição das médias amostrais se aproxima de uma distribuição normal, independentemente da forma da população, quando o tamanho da amostra é suficientemente grande.

  • Qual é a relação entre a média e o desvio padrão das amostras?

    A média das amostras se aproxima da média populacional e o desvio padrão das amostras diminui à medida que o tamanho da amostra aumenta.

  • O que é erro padrão?

    O erro padrão é o desvio padrão da média amostral, calculado como o desvio padrão populacional dividido pela raiz do tamanho da amostra.

Lihat lebih banyak ringkasan video

Dapatkan akses instan ke ringkasan video YouTube gratis yang didukung oleh AI!
Teks
pt
Gulir Otomatis:
  • 00:00:04
    lançamentos de moedas que a gente vai
  • 00:00:06
    trabalhar agora é com a moeda hest e ela
  • 00:00:08
    pode dar Cara ou Coroa 50% cada ou seja
  • 00:00:11
    esse é o nosso histograma da nossa
  • 00:00:12
    população e a gente consegue computar a
  • 00:00:14
    média populacional usando aquela equação
  • 00:00:17
    inha que a gente já tá habituado a média
  • 00:00:19
    mi da população é meio e a gente pode
  • 00:00:21
    calcular também o desvio padrão
  • 00:00:23
    populacional Raí da variância variância
  • 00:00:25
    daquelas dividida por n né desv o padrão
  • 00:00:27
    populacional Sigma é meio agora a gente
  • 00:00:30
    vai fazer uma demonstração da Lei das
  • 00:00:32
    médias usando moedas e a gente vai fazer
  • 00:00:34
    1000 lançamentos então é uma amostra com
  • 00:00:37
    essa nossa população zer e 1 com
  • 00:00:40
    reposição você sempre joga a moeda
  • 00:00:41
    sempre pode tirar Cara ou Coroa a cada
  • 00:00:43
    lançamento daí você gera um vetor cara
  • 00:00:46
    que tem 1000 valores né 0 1 0 0 vai
  • 00:00:49
    aleatório esses valores zeros e uns
  • 00:00:51
    imagina que esses lançamentos são
  • 00:00:52
    sequenciais e você pode computar a
  • 00:00:54
    porcentagem acumulada a cada lançamento
  • 00:00:57
    dividindo soma acumulada pelo número de
  • 00:00:59
    lançamentos e computar então a soma
  • 00:01:00
    acumulada né então aqui se fizesse a
  • 00:01:02
    soma acumulada daria um continuaria um
  • 00:01:03
    continuaria um agora do 3 continuaria 3
  • 00:01:06
    4 5 6 7 só tô fazendo essa soma
  • 00:01:08
    acumulada e dividindo pelo número de
  • 00:01:10
    lançamentos com isso eu chego numa
  • 00:01:11
    porcentagem de caras a do do do primeiro
  • 00:01:14
    lançamento até aquele instante e depois
  • 00:01:16
    eu tô plotando isso lançamentos pela
  • 00:01:18
    porcentagem Eu quero um gráfico de linha
  • 00:01:20
    vermelho com uma linha grossa grossura
  • 00:01:22
    dois quero escrever lançamento como
  • 00:01:24
    Label do eixo X no Label do eixo Y eu
  • 00:01:27
    vou falar porcentagem de caras eu quero
  • 00:01:30
    que o gráfico tenha todo o Range de
  • 00:01:32
    lançamentos né então de 1 a 1000 e os
  • 00:01:34
    limites no Y eu quero que seja de zero a
  • 00:01:36
    1 e pum Cheguei nesse gráfico na
  • 00:01:38
    primeira vez deu cara né depois deu
  • 00:01:40
    coroa coroa caiu num terç né de
  • 00:01:42
    probabilidade depois começou a dar cara
  • 00:01:44
    de novo e depois volta paraa coroa e
  • 00:01:46
    depois e e quando vai fazendo esses
  • 00:01:48
    vários vários e vários lançamentos o que
  • 00:01:50
    acontece é que vai chegando mais e mais
  • 00:01:51
    perto de 50% né a porcentagem de caras
  • 00:01:54
    vai ficando cada vez mais próxima de 50%
  • 00:01:56
    E se eu faço isso várias vezes isso
  • 00:01:58
    acontece com uma regularidade extrema
  • 00:02:00
    tem aquele vermelhinho que a gente já
  • 00:02:01
    tinha feito antes mais outros 10 quase
  • 00:02:03
    todos caíram 50% bem bonitinho lá Essa é
  • 00:02:06
    a lei das médias né então quando você
  • 00:02:08
    tem um n Grande a média da sua amostra
  • 00:02:10
    se aproximar ao mi então a medida que o
  • 00:02:12
    n aumenta o número médio de cara se
  • 00:02:14
    aproxima mais e mais da Média
  • 00:02:15
    populacional e a média amostral x Barra
  • 00:02:18
    né converge pro parâmetro mi é um outro
  • 00:02:21
    jeito de falar a mesma coisa né esses x
  • 00:02:23
    Barras com n pequeno el geram uma
  • 00:02:25
    distribuição mais larga mais dispersa
  • 00:02:27
    mas quando você tem o seu n gigante as
  • 00:02:29
    suas médias ficam muito mais centradas
  • 00:02:31
    no Mi essa é a lógica básica que a gente
  • 00:02:33
    vai ver agora mas a gente vai ver isso
  • 00:02:35
    em diferentes exemplos Vamos retomar
  • 00:02:37
    esse exemplo da moeda que tem uma média
  • 00:02:39
    mi meio Sigma meio e agora a gente vai
  • 00:02:42
    fazer os histogramas dessas
  • 00:02:44
    distribuições de médias quando eu faço
  • 00:02:46
    N1 eu faço amostras de N1 e tiro a média
  • 00:02:50
    a média só vai poder ser zero e 1 Então
  • 00:02:52
    vai manter o mesmo formato da
  • 00:02:54
    distribuição original da população e eu
  • 00:02:56
    chego no nos mesmos valores né do da
  • 00:02:58
    média de X bar e do desvio de X barra
  • 00:03:01
    mas isso aí é desinteressante né vou
  • 00:03:02
    fazer com n maior a média de x Barra que
  • 00:03:05
    continua no 05 só que o desvio ficou um
  • 00:03:09
    pouquinho menor e repetindo essa
  • 00:03:11
    simulação de amostragem com tamanhos de
  • 00:03:14
    amostra de 4 9 e 25 observamos que a
  • 00:03:18
    média das médias das 5000 amostras
  • 00:03:20
    sempre fica bem perto do
  • 00:03:23
    0,5 Ou seja a média dos X Barras é
  • 00:03:26
    sempre no mid da população já O desvio
  • 00:03:30
    padrão das médias dessas 5000 amostras
  • 00:03:33
    fica cada vez menor conforme aumentamos
  • 00:03:35
    os tamanhos das amostras e outra coisa
  • 00:03:38
    interessante é que quanto maior é o
  • 00:03:40
    tamanho da amostra mais o formato da
  • 00:03:43
    distribuição dos xbar se aproxima do
  • 00:03:45
    formato de galciana ou seja quanto maior
  • 00:03:48
    o tamanho da amostra mais normal fica a
  • 00:03:50
    distribuição e eu vou plotar aqui agora
  • 00:03:54
    Como que essa média está ao longo desses
  • 00:03:56
    vários tamanhos aqui eu fui de 1 a 400 e
  • 00:03:58
    a média dos Barras fica sempre lá no
  • 00:04:01
    meio já O desvio ele cai dessa forma
  • 00:04:04
    aqui tá então aqui cada pontinho é cada
  • 00:04:07
    um dos experimentos que eu fiz e eu
  • 00:04:09
    juntei uma linha vermelha ali mostrando
  • 00:04:10
    como é que é a função que relaciona uma
  • 00:04:12
    coisa a outra Ok moeda Vamos fazer outra
  • 00:04:15
    coisa Super Criativa que estatístico
  • 00:04:17
    adora dado né então vamos fazer
  • 00:04:19
    experimento agora com os dados os dados
  • 00:04:20
    tem seis lados é um dado honesto todos
  • 00:04:23
    com a mesma chance a média mi é 3,5
  • 00:04:26
    certo é o centro de massa aqui no 3,5 eu
  • 00:04:29
    posso botar um que ele vai ficar
  • 00:04:30
    equilibrado e o desvio padrão é 1,71 só
  • 00:04:33
    aplicar aquela mesma fulaz inha lá você
  • 00:04:35
    chega nesse Sigma desvio padrão da
  • 00:04:37
    população de 1.71 eu vou fazer a mesma
  • 00:04:40
    brincadeira né Fazer a distribuição das
  • 00:04:42
    médias de 5000 amostras tiro uma amostra
  • 00:04:45
    tiro a média e vou colocando na minha
  • 00:04:46
    tabelinha lá depois eu faço um
  • 00:04:47
    histograma então com N1 eu chego nos
  • 00:04:49
    mesmos valores né deu quase 3,5 desvio
  • 00:04:52
    com 71 e faço com n2 continuou a mesma
  • 00:04:55
    média desvio padrão começa a diminuir e
  • 00:04:57
    começa a mudar a forma né dessa
  • 00:04:59
    distribuição e com n4 menor desvio ainda
  • 00:05:02
    vai surgindo a normal vai surgindo a
  • 00:05:04
    normal tá então com n25 aqui eu tenho a
  • 00:05:07
    minha média a média do x Barra muito
  • 00:05:09
    próximo do Inicial e o desvio do X barra
  • 00:05:12
    e em em 0,37 né que é mais ou menos 1/5
  • 00:05:15
    de 1.71 E tá lá de novo aquela mesma
  • 00:05:18
    coisa que a gente tinha visto a média
  • 00:05:20
    sempre centrada no meio da população e o
  • 00:05:22
    desvio caindo caindo caindo com aquele
  • 00:05:25
    formato de curva igual que a gente tinha
  • 00:05:26
    visto pra moeda mas ISO eu trabalhar com
  • 00:05:28
    uma distribuição normal tem um monte de
  • 00:05:30
    coisa no mundo que que a população Segue
  • 00:05:33
    uma distribuição normal coloquei uma
  • 00:05:34
    droga queria ver se mudava alguma coisa
  • 00:05:36
    na expressão gên vamos supor que a
  • 00:05:38
    população é acima do 3,5 mas na média
  • 00:05:41
    sobe a expressão daquele daquele
  • 00:05:44
    determinado gene em 35% isso poderia
  • 00:05:47
    valer para oscilações da bolsa sei lá
  • 00:05:49
    pega todas as empresas quanto que as
  • 00:05:50
    ações da bolsa variaram Naquele dia
  • 00:05:52
    quando você tem muitos efeitos juntos
  • 00:05:54
    você tem muitos fatores né a economia é
  • 00:05:56
    uma coisa complexa assim como o Genoma é
  • 00:05:58
    uma coisa complexa depende da
  • 00:05:59
    temperatura Depende de outros gênes que
  • 00:06:01
    estão lá então eh todas essas coisas
  • 00:06:03
    juntas tendem a fazer surgir uma
  • 00:06:05
    distribuição que já Segue uma cara
  • 00:06:07
    normal então é uma coisa que muitas
  • 00:06:09
    vezes acontece tem várias distribuições
  • 00:06:10
    que são normais tem várias que também
  • 00:06:12
    não são mas essa é é uma distribuição
  • 00:06:14
    comum de encontrar na natureza e eu fiz
  • 00:06:15
    uma distribuição aqui com média 3,5 e
  • 00:06:18
    Sigma 1.71 você vê que é mesmo é o mesmo
  • 00:06:21
    mi e o mesmo Sigma da anterior né só
  • 00:06:24
    mudei a cara aqui né que antes aqui era
  • 00:06:25
    uma distribuição uniforme discreta só
  • 00:06:28
    podia ter um valor 1 2 3 4 5 6 e agora
  • 00:06:30
    eu peguei uma distribuição contínua que
  • 00:06:32
    os valores podem ficar até negativos
  • 00:06:34
    muito mais positivos do que seis né
  • 00:06:36
    então mudou o Range mudou tudo mantendo
  • 00:06:38
    o mesma média e o mesmo desvio padrão tá
  • 00:06:40
    isso aqui eu fiz no R né Eu só coloquei
  • 00:06:42
    lá minha população é igual a 3,5 mais
  • 00:06:45
    1.71 rnorm de 10.000 né então esse R
  • 00:06:49
    norme vai gerar 10.000 números
  • 00:06:51
    aleatórios com média zero e desvio 1
  • 00:06:53
    isso aqui é que o r faz de fábrica média
  • 00:06:56
    zero mi z0 e Sigma 1 né des o padrão um
  • 00:06:59
    e eu só multiplico esses valores que
  • 00:07:01
    estão centrados em zero com com
  • 00:07:03
    distância média 1 eu multiplico por 1.71
  • 00:07:07
    agora a distância média vai ficar em
  • 00:07:09
    1.71 depois eu desloco essa distribuição
  • 00:07:11
    né a invés de o centro ficar no zero eu
  • 00:07:14
    desloco ele pro 3,5 então eu fiz uma
  • 00:07:16
    população e depois eu só fiz o
  • 00:07:17
    histograma dela desse jeito que eu queri
  • 00:07:19
    essa população com média 3,5 e desvio o
  • 00:07:21
    padrão
  • 00:07:22
    1.71 Mas enfim vamos lá el tem essa
  • 00:07:25
    Distribuição e vamos fazer aquele mesmo
  • 00:07:26
    experimento de 5000 amostras de
  • 00:07:28
    diferentes tamanos tamanhos aqui com N1
  • 00:07:31
    bate com que a gente já tinha visto É
  • 00:07:32
    uma boa estimativa do mi Sigma da
  • 00:07:34
    população e com n2 continua normal o
  • 00:07:37
    desvio padrão vai diminuindo quando eu
  • 00:07:38
    aumento o n o desvio padrão vai ficando
  • 00:07:39
    cada vez menor cada vez mais estreito a
  • 00:07:42
    média do x Barra não varia com o tamanho
  • 00:07:45
    do n mas o O desvio padrão do X bar cai
  • 00:07:48
    cai bastante né O que que você tira a
  • 00:07:51
    partir disso né então quando você faz
  • 00:07:53
    uma amostra grande de uns 25 elementos
  • 00:07:55
    por exemplo você sabe que o seu x Barra
  • 00:07:58
    ele não vai cair num lugar muito extremo
  • 00:08:00
    ele vai cair muito perto da sua média de
  • 00:08:02
    fato porque o desvio padrão da
  • 00:08:04
    distribuição das médias quando você faz
  • 00:08:06
    uma simulação você vê que os valores de
  • 00:08:09
    cada x Barra individualmente eles sempre
  • 00:08:12
    caem perto do do do mi original desvio
  • 00:08:13
    padrão cai muito quando você aumenta o n
  • 00:08:15
    tá você tem um erro ali claro que é
  • 00:08:17
    proporcional ao desvio do x Barra
  • 00:08:19
    daquele tamanho de amostra Considerando
  • 00:08:21
    o Sigma da população mas se você faz uma
  • 00:08:24
    amostra e estima uma amostra só você
  • 00:08:27
    estima O desvio padrão ali e você estima
  • 00:08:30
    o x Barra ali com o tamanho da sua
  • 00:08:32
    amostra você já sabe olha ela tá perto
  • 00:08:34
    proporcional ao desvio padrão que eu
  • 00:08:36
    consegui estimar e proporcionar o
  • 00:08:37
    tamanho da minha amostra tá esse é o
  • 00:08:40
    fundamento né da Lei das médias que é o
  • 00:08:42
    fundamento depois a gente vai ver aí do
  • 00:08:43
    do intervalo de confiança tá mas esse
  • 00:08:46
    experimento que a gente fez aqui essa
  • 00:08:47
    simulação que a gente fez aqui mostrando
  • 00:08:49
    que existe uma maior dispersão com com
  • 00:08:51
    tamanho de amostra Pequeno e Menor
  • 00:08:53
    dispersão com tamanho de amostra grande
  • 00:08:55
    é o teorema central do limite e o
  • 00:08:57
    teorema central do limite Na verdade tem
  • 00:08:58
    esse aspecto da redução do desvio padrão
  • 00:09:00
    Mas ele também tem Esse aspecto de gerar
  • 00:09:04
    uma distribuição que segue o formato de
  • 00:09:07
    uma normal quando você tava trabalhando
  • 00:09:09
    com as moedas ou com a média dos valores
  • 00:09:11
    dos dados ela demorava um pouquinho para
  • 00:09:13
    ficar normal Mas quando você vai
  • 00:09:15
    aumentando n você faz com que a
  • 00:09:17
    distribuição das médias x bar siga uma
  • 00:09:19
    distribuição normal esse é um aspecto
  • 00:09:21
    importante do teorema central do limite
  • 00:09:22
    né então que é emergência de uma
  • 00:09:24
    distribuição normal mesmo quando a
  • 00:09:26
    população não é normalmente distribuída
  • 00:09:29
    né então aqui aqui era uma distribuição
  • 00:09:31
    normalmente distribuída Mas mesmo quando
  • 00:09:32
    não era quando era aquela história do
  • 00:09:34
    dado a distribuição normal também surgia
  • 00:09:36
    eí aquele outro lance né de que muitas
  • 00:09:38
    das das populações muitas das medidas na
  • 00:09:40
    natureza são normalmente distribuídas ou
  • 00:09:43
    aproximadamente normais então além de
  • 00:09:45
    ter essa questão de surgir a curva
  • 00:09:47
    normal você tem também que o a média do
  • 00:09:49
    x Barra continua sendo umida a população
  • 00:09:52
    e o desvio padrão das médias amostrais
  • 00:09:54
    diminuem seguindo essa equação Sigma
  • 00:09:58
    dividido por √
  • 00:09:59
    com N1 você vai ter um desvio padrão das
  • 00:10:02
    médias que é 1/1 do Sigma da população
  • 00:10:06
    Esses são os elementos que a gente tem
  • 00:10:07
    que a média do X Barras se aproxima
  • 00:10:09
    muito bem do mi se desvio padrão do X
  • 00:10:11
    Barras se aproxima muito do Sigma
  • 00:10:14
    dividido pela ra n e esse é o teorema
  • 00:10:16
    central do limite e esse aqui vocês já
  • 00:10:18
    devem ter visto falar né Sigma dividido
  • 00:10:20
    por √ n é o erro padrão tá é o erro
  • 00:10:24
    padrão Ou desvio o padrão da Média né
  • 00:10:25
    faz todo sentido eu desvio o padrão da
  • 00:10:27
    Média que você pensa que existe uma
  • 00:10:28
    distribuição da das médias e essa
  • 00:10:30
    distribuição das médias tem um desvio
  • 00:10:32
    padrão que é dado por esse valor vamos
  • 00:10:34
    ver no R rapidinho como que foi feito
  • 00:10:36
    isso aqui é só para revisar vamos rodar
  • 00:10:38
    linha a linha isso aqui é para limpar
  • 00:10:39
    todas as variáveis a gente definiu a
  • 00:10:41
    nossa população aqui a gente consegue
  • 00:10:43
    definir aquelas outras populações a
  • 00:10:44
    gente volta aqui pro script para rodar
  • 00:10:45
    essas coisas o histograma da população
  • 00:10:48
    com os limites no x que são os limites
  • 00:10:51
    da população numa cor cinza os Breaks
  • 00:10:55
    desse histograma né onde que eu vou
  • 00:10:56
    cortar cada categoria do histograma vai
  • 00:10:58
    seguir essa regra aqui né então que ele
  • 00:11:00
    vai do valor mínimo da população até o
  • 00:11:02
    valor máximo da população dividindo em
  • 00:11:05
    30 pedaços e do mesmo tamanho né E tá aí
  • 00:11:08
    desenhado o histograma nosso grafic a
  • 00:11:11
    nossa população e depois a gente extrai
  • 00:11:13
    a média nossa média é meio nosso desvio
  • 00:11:16
    padrão aqui a gente tem que fazer na mão
  • 00:11:18
    né a gente não pode usar o sd se fizesse
  • 00:11:20
    o sd da população Paria 07 né o sd ele
  • 00:11:25
    sempre coloca o n-1 lá embaixo o r é
  • 00:11:27
    para trabalhar com amostras né para
  • 00:11:28
    trabalhar com mundo real ali então ele
  • 00:11:30
    já vem preparado para fazer desvio
  • 00:11:32
    padrão de amostra só clico o F1 em cima
  • 00:11:34
    dele ele vai aparecer aqui Standard
  • 00:11:36
    deviation aqui ó com uma variância isso
  • 00:11:39
    aqui usa o denominador n - 1 mas a gente
  • 00:11:42
    quer fazer o Sigma né então a gente tem
  • 00:11:43
    que fazer na mão e o nosso Sigma não é
  • 00:11:45
    07 ele é meio também vamos fazer a nossa
  • 00:11:47
    simulação para 25 elementos vou criar um
  • 00:11:50
    vetor onde vou onde vou salvar os meus
  • 00:11:52
    valores de x Barra e vou fazer minhas
  • 00:11:54
    5000 amostragens para cada amostragem
  • 00:11:56
    então vou fazer amostragem um né mostr
  • 00:11:59
    agem um aí eu vou procurar na minha
  • 00:12:02
    população que tem 0 e 1 25 elementos e
  • 00:12:05
    faço isso com reposição e daí ele me
  • 00:12:07
    gera lá um vetor de zeros e uns isso
  • 00:12:09
    aqui eu vou chamar de minha amostra toda
  • 00:12:11
    vez que eu seleciono aqui eu colo uma
  • 00:12:12
    linha eu tô dando control enter só para
  • 00:12:14
    relembrar a aí tiro a média dessa
  • 00:12:16
    amostra e eu tô associando isso ao x
  • 00:12:18
    Barra na posição um eu faço isso lá
  • 00:12:20
    minhas 5000 vezes né vou rodar rodar de
  • 00:12:23
    novo ele vai rodar a mostragem um de
  • 00:12:24
    novo e já tá aí lá agora el tem um x
  • 00:12:26
    Barra com um montão de valores fizemos o
  • 00:12:28
    histograma na mesma lógica lá que a
  • 00:12:30
    gente tinha feito antes tá lá o meu
  • 00:12:31
    histograma do x Barra a média no meu x
  • 00:12:34
    Barra deu 05 né então que é perto do meu
  • 00:12:36
    Mi tá batendo e o desvio padrão do x
  • 00:12:39
    Barra deu
  • 00:12:41
    0.099 que eu imagino que seja o quê o
  • 00:12:44
    nosso Sigma dividido pelo pela raiz
  • 00:12:46
    quadrada né do n né então n elevado a me
  • 00:12:50
    Então o que eu esperava era que desse 01
  • 00:12:52
    deu
  • 00:12:53
    0.999 a gente conseguiu chegar bem no
  • 00:12:55
    que a teoria diz sobre aleatoriedade né
  • 00:12:57
    então eu quero fazer essa brincadeira de
  • 00:12:59
    amostragem para tamanho de amostra 1 2 3
  • 00:13:02
    4 falei que meus n estão num vetor né
  • 00:13:04
    nvec né vetor de de tamanho de amostra e
  • 00:13:07
    para cada tamanho de amostra eu vou
  • 00:13:10
    colocar um valor de média e um valor de
  • 00:13:12
    desvio então eu vou criar vetores onde
  • 00:13:14
    eu vou salvar a média dos X Barras e o
  • 00:13:16
    desvio dos X Barras e daí eu vou rodar
  • 00:13:19
    um loop aqui o loop que ele vai rodar
  • 00:13:21
    essa variável count do valor um até o
  • 00:13:24
    tamanho do vetor de nes né vetor de nes
  • 00:13:27
    tem 14 elementos então meu o count vai
  • 00:13:29
    de 1 a 14 então quando eu rodo o count
  • 00:13:31
    na primeira vez ele já computa todo
  • 00:13:34
    aquele eu preciso fazer um count aqui
  • 00:13:36
    count igual a um vai fazer amostragem
  • 00:13:39
    aqui a primeira amostragem que ele vai
  • 00:13:40
    fazer vamos falar amostragem igual a 1 a
  • 00:13:43
    primeira amostragem ele vai criar uma
  • 00:13:45
    amostra daquela população com o nvec
  • 00:13:48
    daquela posição da posição um né o count
  • 00:13:50
    é um o nvec que a gente vai caçar
  • 00:13:52
    primeiro é um né esse valor aqui e vai
  • 00:13:55
    fazer com reposição Então tá lá a nossa
  • 00:13:57
    amostra de um elemento
  • 00:14:01
    né E quando você pede a média de uma
  • 00:14:03
    amostra de um elemento ela retorna
  • 00:14:04
    aquele valor mesmo e tá salvando isso no
  • 00:14:06
    nosso x bar amostragem a gente faz isso
  • 00:14:08
    aqui das nossas 5000 vezes e depois tira
  • 00:14:11
    a média dos X Barras tá e desvio o
  • 00:14:13
    padrão do X Barras tá vamos rodar esse
  • 00:14:16
    treco inteiro aqui então agora a gente
  • 00:14:19
    tem um uma média x Barra para cada um
  • 00:14:22
    desses valores de tamanho de amostra
  • 00:14:24
    sempre aqui no meio né E aqui um desvio
  • 00:14:27
    padrão do X bar para cada tamanho dessas
  • 00:14:29
    amostras também e aí você vê caindo né e
  • 00:14:32
    agora a gente só plota né o tamanho pela
  • 00:14:34
    média exp plotamos os nossos valores de
  • 00:14:37
    média então tamanho de amostra no x a
  • 00:14:39
    média dos 5000 x Barras né Para aqueles
  • 00:14:41
    tamanhos de amostra no Y aí o que eu
  • 00:14:43
    quero fazer também é plotar um outro
  • 00:14:45
    gráfico por cima desse segura o gráfico
  • 00:14:47
    que eu quero plotar coisa por cima né
  • 00:14:49
    daí você roda esse esse comando aqui par
  • 00:14:51
    New iG true e o que eu pedi para colocar
  • 00:14:53
    lá foi para todo aquele meu Range de de
  • 00:14:56
    m para ele escrever o meu Mi no o valor
  • 00:14:59
    X1 para o y5 e o outro ponto é
  • 00:15:03
    x400 para y52 também então ele desenhou
  • 00:15:06
    essa linha né tipo é linha a cor é
  • 00:15:09
    vermelho eu falo para ele plotar
  • 00:15:11
    exatamente o mesmo xlink que já tava o
  • 00:15:13
    mesmo Y link que já tava né e eu falo Ah
  • 00:15:17
    não plota De novo sen não fica feio
  • 00:15:18
    depois que a gente plotou as médias
  • 00:15:20
    vamos plotar os desvios né que a mesma
  • 00:15:23
    coisa o mesmo caminho só que a gente
  • 00:15:25
    mudou a variável a gente vai colocar o
  • 00:15:26
    desvio x bar o primeiro gráfico é só dos
  • 00:15:28
    pontinhos né Olha só o segundo gráfico o
  • 00:15:31
    que que é é o Sigma dividido pela raiz
  • 00:15:35
    do n o gráfico em vermelho já é o que a
  • 00:15:38
    teoria diz pra gente o teorema central
  • 00:15:40
    do limite né E você vê que cai bem um
  • 00:15:43
    bem em Cinha do outro mesmo né e a gente
  • 00:15:45
    pode checar se esse caiu bem em Cinha do
  • 00:15:47
    outro faz uma razão entre o desvio x
  • 00:15:49
    Barra e o que a teoria o teorema citado
  • 00:15:52
    do limite diz paraa gente se der um
  • 00:15:54
    exatamente em cima do outro tem que dar
  • 00:15:56
    quanto um certo você pode tá dando
  • 00:15:59
    exatamente o um aqui né então você pode
  • 00:16:02
    rodar e olhar os valores que deram né
  • 00:16:04
    tudo valor muito próximo de um né eu
  • 00:16:06
    posso fazer o gráfico agora plota aqui
  • 00:16:08
    as razões e plota a linha né A constante
  • 00:16:11
    um só para mostrar que tá funcionando
  • 00:16:13
    para todos os casos muito bem né Tá
  • 00:16:15
    fizemos esse primeiro caso eu só quero
  • 00:16:17
    rodar agora paraa população de dados
  • 00:16:20
    pron tá aqui o histograma da população
  • 00:16:23
    tem 1 2 3 4 5 6 parece uma distribuição
  • 00:16:26
    inha normal bonitinho fáil aquele mesmo
  • 00:16:28
    ento pros diferentes tamanhos de amostra
  • 00:16:30
    né plotas médias tudo no 3,5 o mid dado
  • 00:16:35
    o desvio padrão cai bem em Cinha do
  • 00:16:37
    Sigma dividido por ra n quando eu faço
  • 00:16:40
    aquela razão entre desvio e Sigma tá
  • 00:16:43
    tudo em cima do um funciona igualzinho o
  • 00:16:45
    outro caso aqui só fazendo de novo
  • 00:16:49
    mostrando que funciona né aqui nossa
  • 00:16:51
    população o mi e o Sigma né novo aquele
  • 00:16:54
    experimento de amostragem com 25
  • 00:16:56
    elementos a gente vê que fica muito mais
  • 00:16:57
    magrinha normal né o Sigma da população
  • 00:17:00
    dividido pela raiz do n e dividido por 5
  • 00:17:03
    né que o nosso n é 25 Sigma er 0.7 o
  • 00:17:06
    padrão 03 S vamos dividir o Sigma pelo
  • 00:17:08
    des padrão tem que dar cinco percebeu aí
  • 00:17:10
    5.03 então exatamente o que teia disso
  • 00:17:12
    sonica Maravilha
  • 00:17:13
    is funa Maravilha tá a média sempre no
  • 00:17:16
    no valor que tinha colocado desvio desir
  • 00:17:18
    n e e a razão sempre um chega de R um
  • 00:17:21
    pouquinho Tera central do limite
  • 00:17:23
    distribuição das médias Segue uma
  • 00:17:24
    distribuição normal que tem dois
  • 00:17:26
    parâmetros um parâmetro média que ele
  • 00:17:28
    cai em cima do mi e um parâmetro desvio
  • 00:17:31
    padrão que cai em cima do Sigma da
  • 00:17:33
    população dividido pela raiz do e e
  • 00:17:35
    porque raiz esse nome né teorema central
  • 00:17:37
    do limite o Central se refere a
  • 00:17:39
    fundamental ele tá como ele é base para
  • 00:17:42
    fazer um monte de coisa n est e no
  • 00:17:43
    limite porque ele só funciona no limite
  • 00:17:46
    né quando você tem um n é grande o
  • 00:17:48
    suficiente né se você tiver um n muito
  • 00:17:50
    pequeno você não tem essa propriedade
  • 00:17:52
    fundamental válida o teorema central do
  • 00:17:54
    limite só funciona quando você tem um n
  • 00:17:56
    grande quando você tem uma distribuição
  • 00:17:58
    normal a sua população Segue uma
  • 00:17:59
    distribuição normal ele já funciona de
  • 00:18:01
    cara a distribuição das médias vai ser
  • 00:18:03
    normal mesmo que você use um n
  • 00:18:05
    ridiculamente pequeno mas quando você
  • 00:18:08
    tem uma distribuição que não segue uma
  • 00:18:09
    distribuição normal uma distribuição
  • 00:18:11
    uniforme uma distribuição bimodal enfim
  • 00:18:13
    daí você eh tem que fazer um n muito
  • 00:18:16
    maior para conseguir observar eh essa
  • 00:18:19
    emergência da normalidade a gente tá
  • 00:18:21
    vendo que ela tem uns probleminhas né
  • 00:18:22
    ela funciona no infinito tô mostrando a
  • 00:18:23
    ferramenta com problemas mas depois a
  • 00:18:25
    gente vai fazer ela ficar mais poderosa
  • 00:18:27
    ainda tá próximas aulas mas esse que é o
  • 00:18:29
    princípio básico né distribuição das
  • 00:18:30
    médias amostrais quando você tem um n
  • 00:18:33
    Grande a sua distribuição das médias
  • 00:18:34
    amostrais é sempre as mesmas é sempre
  • 00:18:36
    uma normal ou galciana d na mesma Ela
  • 00:18:38
    tem os parâmetros lá né Sigma que entra
  • 00:18:40
    aqui e aqui e ela tem o mi que entra
  • 00:18:42
    aqui aí o x que é a coisa que a gente
  • 00:18:44
    varia no eixo X né e o resto é tudo
  • 00:18:46
    número né enfim são dois parâmetros que
  • 00:18:48
    a gente tem nessa função o mi e o Sigma
  • 00:18:51
    e a gente pode usar essa escala de valor
  • 00:18:53
    bruto valor em centímetro quilo que a
  • 00:18:55
    gente mediu de fato Ou a gente pode
  • 00:18:57
    fazer uma escala em erro padrão uma
  • 00:19:00
    escala de desvio padrão da Média que
  • 00:19:02
    aqui vira o zero aí um desvio padrão da
  • 00:19:04
    média para lá e para cá essa a escala Z
  • 00:19:07
    né se vê aquela tabela Z que tem tudo
  • 00:19:09
    quanto é livro de estatística que
  • 00:19:11
    associa valores de Z que é os que estão
  • 00:19:13
    em aqui com valores de
  • 00:19:15
    probabilidade né para cada valor de Z
  • 00:19:18
    ela vai ter um valor de probabilidade e
  • 00:19:20
    num caso aqui como esse a gente pode
  • 00:19:21
    procurar agora eu quero procurar na
  • 00:19:23
    minha tabela qual que seria a
  • 00:19:24
    probabilidade Então essa área nesse
  • 00:19:27
    pedaço aqui para um Z = 0 como é que eu
  • 00:19:30
    acho isso aqui na minha tabela eu já sei
  • 00:19:31
    que isso aqui é 50% né a distribuição
  • 00:19:34
    normal é simétrica unimodal então eu sei
  • 00:19:36
    que se eu colocar lá no pico dela eu vou
  • 00:19:38
    ter meu Z = 0 isso aqui tem que dar 50%
  • 00:19:41
    tem lá na minha tabela para um z0 né 0.0
  • 00:19:45
    Na primeira casa decimal e na segunda
  • 00:19:47
    casa decimal zero também esse aqui é a
  • 00:19:49
    segunda casa decimal que tá colocado em
  • 00:19:50
    cima o 50% ele tá no
  • 00:19:54
    z0.00 e o que ele tá mostrando pra gente
  • 00:19:56
    aqui é a integral do valor de menos
  • 00:20:00
    infinito até o valor de Z essa tabela no
  • 00:20:03
    final Então ela mostra a área acumulada
  • 00:20:05
    né o integral do menos infinito até os
  • 00:20:08
    valores de z o que tem nessa tabela no
  • 00:20:11
    fundo é essa curva associando valores de
  • 00:20:14
    Z que é o que tão embaixo Aqui com
  • 00:20:16
    valores de probabilidade acumulada então
  • 00:20:18
    isso aqui é a distribuição normal com as
  • 00:20:20
    áreas essa área tem 0.1% essa área tem
  • 00:20:24
    2.1% 13.6 por 34% se você somar tudo
  • 00:20:28
    isso aqui vai dar o 50 né E se você
  • 00:20:30
    somar com o outro lado dá um né que a
  • 00:20:32
    probabilidade é sempre um sempre tem que
  • 00:20:33
    somar 100% Qual que é a área do menos
  • 00:20:35
    infinito até o -4 que estaria aqui mais
  • 00:20:38
    ou menos né -4 desvio padrão Aí é zero
  • 00:20:41
    aí ó o 3 tá no zero quase ali né mas daí
  • 00:20:44
    você vai subindo para o -2 aí ele já tem
  • 00:20:47
    2.2 e quando você chega no z0 você chega
  • 00:20:50
    na integral 50% né a área acumulada é
  • 00:20:54
    0.5 e assim você segue até chegar no
  • 00:20:56
    100% que quando você pegou ual a
  • 00:20:58
    integral do menos infinito até o 5 e é
  • 00:21:02
    isso que tá mostrado aqui nessa tabela
  • 00:21:03
    tá então essa essa área né a integral do
  • 00:21:06
    menos infinito até o valor de z eu
  • 00:21:08
    queria saber quais são os valores
  • 00:21:10
    Associados a esse 2,5 desse lado e esse
  • 00:21:13
    2,5 desse lado para ter uma área no meio
  • 00:21:15
    de 95% eu consigo achar isso nessa
  • 00:21:18
    tabela é só eu procurar Onde tá o 2,5 e
  • 00:21:21
    o 2,5 não tem porque ela começa no 50 né
  • 00:21:23
    no z0 não tem valor negativo Tá mas ela
  • 00:21:26
    é simétrica então isso não é um problema
  • 00:21:27
    eu posso procurar então o 97,5 que é o
  • 00:21:30
    2,5 daqui mais os 95 daqui tá 80 e tanto
  • 00:21:34
    90 e tanto 97,5 achei aqui ó ele tá
  • 00:21:38
    associado a qual valor de z
  • 00:21:43
    1.96 eu posso botar lá integral do menos
  • 00:21:45
    infinito até 1.96 é o
  • 00:21:48
    97,5 Mas como eu sei que isso aqui é
  • 00:21:51
    simétrico né o Men 1.96 tá por outro
  • 00:21:54
    lado ali eu só ponho um negativo para
  • 00:21:56
    ter 95% de probabilidade numa
  • 00:21:59
    distribuição normal com média zero
  • 00:22:01
    desvio padrão um eu tenho que pegar
  • 00:22:03
    entre o - 1.96 até o mais 1.96 mas isso
  • 00:22:07
    aqui cara é ano 70 raivoso assim tabela
  • 00:22:10
    horrível não queremos brincar com isso a
  • 00:22:12
    gente quer fazer isso no R né que é
  • 00:22:14
    muito mais fácil bom primeiro a gente já
  • 00:22:16
    tinha visto como é que fazia números
  • 00:22:18
    aleatórios vindo de uma distribuição
  • 00:22:19
    normal que era o r enorme aqui eu tô
  • 00:22:21
    plotando no x de 1 a 100 e aqui os ele
  • 00:22:25
    vai me dar 100 valores aleatórios que
  • 00:22:27
    vem de uma distribuição normal com média
  • 00:22:29
    zero desvio padrão um daí ele plotou
  • 00:22:31
    valores aleatórios ali você vê que é
  • 00:22:32
    mais mais pesado né Tem mais número
  • 00:22:35
    perto do um e pouquinho número acima do
  • 00:22:37
    dois não tem quase nada né Esse é para
  • 00:22:39
    gerar números aleatórios mas eu quero
  • 00:22:41
    fazer a distribuição de densidade de
  • 00:22:43
    probabilidade essa equação tá eu só
  • 00:22:46
    tenho que usar a função d norme d de
  • 00:22:48
    densidade né Eu quero fazer a função de
  • 00:22:51
    densidade de probabilidade na normal e
  • 00:22:54
    eu quero fazer isso aqui pros valores de
  • 00:22:56
    Z né valores de Z que vão de -4
  • 00:22:59
    até 4 o Sec eu posso usar o by eu posso
  • 00:23:01
    usar o length né Vocês já viram que dá
  • 00:23:03
    para usar de dois jeitos eu quero então
  • 00:23:05
    do do menos 4 até o 4 por pulinhos de 01
  • 00:23:09
    né Então isso que eu vou botar no x aqui
  • 00:23:11
    aí no Y eu vou botar o dorme desses
  • 00:23:14
    valores de x né então eu botei a mesma
  • 00:23:16
    coisa aqui aqui e daí eu tenho minha
  • 00:23:18
    distribuição normal que vai do Z - 4 até
  • 00:23:21
    o mais 4 eu podia botar mais né normal
  • 00:23:23
    vai de menos infinito até mais infinito
  • 00:23:25
    só que só tem variação aí enfim tá aí
  • 00:23:28
    desenhado a nossa função densidade de
  • 00:23:29
    probabilidade tá esse é um pedaço da
  • 00:23:32
    coisa isso aqui não é o que a tabela faz
  • 00:23:33
    né O que a tabela faz é mostrar Z e
  • 00:23:37
    probabilidade acumulada né a integral né
  • 00:23:39
    do menos infinito até o valor de Z E
  • 00:23:41
    para isso a gente usa o outro o p de
  • 00:23:42
    probabilidade né probabilidade vindo de
  • 00:23:45
    uma distribuição normal então quero a
  • 00:23:46
    função densidade de probabilidade
  • 00:23:48
    acumulada probabilidade embaixo de cada
  • 00:23:51
    ponto aqui é é nada né você não consegue
  • 00:23:53
    fazer integral de um ponto você tem que
  • 00:23:55
    colocar o intervalo né Aqui tem um
  • 00:23:56
    intervalo eu fiz aqui eu quero integral
  • 00:23:59
    do menos infinito até cada valor de Z
  • 00:24:01
    aqui colocando mesma aquela mesma
  • 00:24:03
    sequência de -4 a 4 e falando quero
  • 00:24:06
    probabilidade acumulada de menos
  • 00:24:07
    infinito até cada um desses valores aqui
  • 00:24:09
    e daí ele desenha aquela função
  • 00:24:11
    densidade de probabilidade acumulada no
  • 00:24:13
    zero dá o 50% né esse é um pedaço eu
  • 00:24:16
    quero fazer a função inversa né Ou seja
  • 00:24:18
    eu quero o quanti eu quero colocar
  • 00:24:20
    valores entre 0 e 1 né entre 0 e 100% e
  • 00:24:23
    ele vai me dar Qual que é o valor do Z
  • 00:24:25
    esse aqui então é o quanti né o q enorme
  • 00:24:28
    isso aqui é a mesma coisa que é só que
  • 00:24:29
    com os estos invertidos então eu dou um
  • 00:24:31
    valor de zero a 1 e ele me retorna Qual
  • 00:24:33
    que é o z ou seja com essas coisas todas
  • 00:24:36
    aqui eu tenho tudo que tem naquela
  • 00:24:38
    tabela só que prático é sempre legal dar
  • 00:24:41
    uma olhada nessa tabela que você pega um
  • 00:24:42
    pouco de intuição mas na hora do vamos
  • 00:24:44
    ver é R né então R enorme D enorme P
  • 00:24:47
    enorme e q enorme como é que eu
  • 00:24:49
    trabalharia naquele caso ali né então o
  • 00:24:51
    p enorme daquele Z Qual que é a
  • 00:24:53
    probabilidade de menos infinito até zero
  • 00:24:55
    50% e qual que é o quanti associado a
  • 00:24:58
    área de 50% qual que é o z associado a
  • 00:25:01
    probabilidade de 50% daí me retorna O Z
  • 00:25:03
    0 Qual que é a probabilidade associada
  • 00:25:06
    ao - 1.96 e 1.96 daí ele vai me dar lá
  • 00:25:10
    os valores de probabilidade né e o que
  • 00:25:12
    enorme Qual que é o z associado a
  • 00:25:14
    probabilidade de 2,5% e 97,5 e daele me
  • 00:25:18
    solta o quanti - 1.96 e mais 1.96 então
  • 00:25:22
    Tom aí a gente já viu que a normal é
  • 00:25:23
    importante pelo teorema central do
  • 00:25:25
    limite né sabe o formato da curva e sabe
  • 00:25:27
    os parâmetros dessa curva e a gente viu
  • 00:25:29
    que tem esse jeito de trabalhar mas é
  • 00:25:30
    sempre com uma distribuição normal
  • 00:25:32
    padrão Poxa cara eu não quero trabalhar
  • 00:25:34
    com a distribuição normal padrão né
  • 00:25:36
    alturas das pessoas a O Mi é é por volta
  • 00:25:39
    de 1,70 O desvio padrão é 15 cm mas o
  • 00:25:43
    que vocês estão me dando é uma normal
  • 00:25:44
    padrão de mi0 e Sigma 1 mas daí é só
  • 00:25:48
    transformar né multiplica primeiro pelo
  • 00:25:50
    desvio padrão e depois soma a média e
  • 00:25:52
    aqui o que a gente tem que fazer é o
  • 00:25:53
    caminho inverso pegar a distribuição
  • 00:25:55
    subtrair a média e depois dividir pelo
  • 00:25:58
    desvio padrão exatamente o processamento
  • 00:26:00
    inverso do que tá ali então a gente
  • 00:26:01
    consegue fazer de uma distribuição
  • 00:26:03
    qualquer chegar na distribuição padrão
  • 00:26:05
    por esse procedimento aqui a gente faz o
  • 00:26:06
    oposto sair de uma distribuição padrão e
  • 00:26:08
    chegar numa distribuição com a média e
  • 00:26:11
    desvio padrão de interesse pesado leve
  • 00:26:13
    tranquilo fácil Tá então vamos ver se
  • 00:26:16
    funcionou mesmo vamos usar esses zores
  • 00:26:18
    teorema central do limite vamos fazer
  • 00:26:20
    essa coisa toda vamos supor que a gente
  • 00:26:22
    saiba que a distribuição de QI é uma
  • 00:26:24
    distribuição normal com média Mi sem
  • 00:26:27
    desvio padrão Sigma 15 a população é
  • 00:26:30
    assim aí eu seleciono 100 crianças e
  • 00:26:32
    avalio os qis Qual é a chance de
  • 00:26:35
    obtermos a média da amostra 104 ou mais
  • 00:26:38
    tá então a gente tem uma população de q
  • 00:26:41
    com mi 100 Sigma 15 selecionamos um n de
  • 00:26:45
    100 crianças Qual que é a chance de
  • 00:26:47
    obter uma média da amostra 104 ou mais
  • 00:26:51
    alta né Lembrando que use score era
  • 00:26:53
    desse jeito vamos lá como é que a gente
  • 00:26:54
    faz isso primeiro a gente pega esse 104
  • 00:26:57
    que é a nossa medida ali né subtrai do
  • 00:26:59
    mi e divide pelo Sigma certo e daí a
  • 00:27:03
    gente pegou aqui então deu 4 dividido
  • 00:27:06
    pelo 15 que é o nosso Sigma e deu 0,27
  • 00:27:09
    então o nosso Z deu 0,27 é só procurar
  • 00:27:12
    na tabela onde que tá o 0,27 que dá 0,60
  • 00:27:15
    que faz o p enorme lá da função dá 0,60
  • 00:27:18
    também e depois a gente chega lá que a
  • 00:27:20
    probabilidade deu 0.4 Então pega aqui
  • 00:27:24
    aplica o valor não precisa nem pensar né
  • 00:27:27
    Tá certo isso
  • 00:27:30
    Por que que não tá
  • 00:27:32
    certo não tá certo porque a gente não tá
  • 00:27:36
    trabalhando com uma observação a gente
  • 00:27:37
    está trabalhando com 100 isso aqui a
  • 00:27:39
    gente tá colocando o Sigma que a gente
  • 00:27:41
    pegou da população o 15 a gente não usou
  • 00:27:44
    o teorema central do limite a gente não
  • 00:27:46
    botou o nosso Sigma dividido pela raiz
  • 00:27:48
    do n a gente botou só o Sigma aqui não
  • 00:27:50
    pode pegar é só aplicar fórmula né esse
  • 00:27:53
    Sigma aqui ele não é o Sigma da
  • 00:27:55
    população ele é o erro padrão o Sigma de
  • 00:27:58
    dividido pela raiz do n porque a gente
  • 00:27:59
    tá trabalhando com uma média dessas
  • 00:28:01
    várias crianças Então a gente tem que
  • 00:28:03
    pegar esse Sigma e dividir por raiz 100
  • 00:28:05
    dividir por 10 ou seja a gente tem que
  • 00:28:07
    calcular o erro padrão e depois jogar lá
  • 00:28:09
    naquele cálculo do Z Então você coloca o
  • 00:28:11
    seu 104 subtrai O Mi da população e
  • 00:28:15
    divide pelo erro padrão 1,52 e daí tá um
  • 00:28:18
    z de 2.7 e depois você procura o 2.67 e
  • 00:28:22
    daí dá o 0.99 olha só deu lá na frente
  • 00:28:25
    né 0.99 deu lá pra frente área de 9 %
  • 00:28:29
    então fazer essa continha do Z dividindo
  • 00:28:32
    pelo erro padrão e depois você calcula
  • 00:28:34
    essa área tinha visto que dá o
  • 00:28:38
    0.9962 maior do que isso é só o
  • 00:28:41
    0.4% tá então é super raro de achar uma
  • 00:28:44
    média de 100 crianças com Q igual ou
  • 00:28:48
    maior a 104 vamos rodar isso aqui no
  • 00:28:50
    resse exercício de q das crianças né
  • 00:28:52
    então limpar tudo esseo cara e quero
  • 00:28:54
    limpar aqui tá então vou fazer na unha a
  • 00:28:57
    gente viu que a tem esse mi e esse Sigma
  • 00:28:59
    certo 100 deq com Sigma 15 tá Daí a
  • 00:29:02
    gente faz uma amostra de 100 crianças
  • 00:29:05
    daí a pergunta é Qual que é a chance de
  • 00:29:07
    encontrar uma amostra desse tamanho com
  • 00:29:11
    uma média maior ou igual a 104 tá então
  • 00:29:13
    a gente tem o nosso x Barra o que a
  • 00:29:14
    gente tá perguntando é isso aqui como é
  • 00:29:16
    que a gente faz essa conta tá primeiro é
  • 00:29:18
    fazer aquele Z né que é pegar o seu x
  • 00:29:21
    Barra subtrair do Mi né então tenho aqui
  • 00:29:24
    quatro e divide pelo erro padrão que é o
  • 00:29:27
    sig dividido pela ra do
  • 00:29:29
    n então aqui deu 1,52 né então o nosso Z
  • 00:29:34
    deu
  • 00:29:35
    2.67 lá depois a gente usa a tabela ou
  • 00:29:38
    usa o r para fazer essa conta então o p
  • 00:29:41
    norme do Z é
  • 00:29:43
    0.99 da gente faz 1 menos P que daí dá
  • 00:29:46
    os 0 4% né beleza essa essa é a conta
  • 00:29:51
    para resolver aquele exercic aqui né né
  • 00:29:55
    distribuição normal com 100 15 uma m
  • 00:29:57
    amra maior ou igual 104 isso aqui é
  • 00:29:59
    fazendo na unha usando teoria né usando
  • 00:30:02
    teorema central do limite né a gente
  • 00:30:04
    pode resolver por simulação sem usar
  • 00:30:06
    teorema central do limite ele o teorema
  • 00:30:08
    central do limite sempre tá rodando por
  • 00:30:10
    no fundo né Ele é só uma um uma lei que
  • 00:30:12
    que governa a natureza né e o o e a
  • 00:30:15
    gente só que a gente não vai precisar
  • 00:30:17
    colocar aquela equação Zinha a gente
  • 00:30:18
    botou essa equação zinha aqui né a gente
  • 00:30:20
    falou olha Então tá usando tá usando seu
  • 00:30:21
    teorema central do limite taxa sabendo
  • 00:30:23
    que é uma distribuição normal por isso
  • 00:30:25
    que a gente tá colocando PME aqui porque
  • 00:30:26
    a gente sabe que isso aí que ser uma
  • 00:30:28
    distribuição normal que tem esses
  • 00:30:29
    parâmetros mi e Sigma dividido por ra de
  • 00:30:32
    n Essa é a distribuição das médias né
  • 00:30:34
    Então essa essa é o desvio padrão da
  • 00:30:36
    distribuição das médias e a gente só tá
  • 00:30:38
    vendo onde que tá aquele Z nessa
  • 00:30:40
    distribuição normal e calculando a
  • 00:30:42
    probabilidade ali mas a gente poderia
  • 00:30:44
    Não nem pensar em teorema central do
  • 00:30:46
    limite né não é mais prático Tá mas é um
  • 00:30:49
    jeito mais fácil de entender talvez tá
  • 00:30:51
    mas só para ver que isso aqui funciona
  • 00:30:53
    mesmo você não precisa o teorema Central
  • 00:30:55
    limite ele surge na tua mão população de
  • 00:30:56
    crianças lá ela tem média 100 desvio
  • 00:30:59
    padrão 15 produziu a nossa população de
  • 00:31:01
    de 100.000 crianças aqui começamos lá
  • 00:31:03
    construimos a nossa população e temos o
  • 00:31:05
    nosso histograma da nossa população tá
  • 00:31:08
    então a nossa população tem média 100 O
  • 00:31:11
    desvio padrão 15 né Então essa é a nossa
  • 00:31:13
    população de que de criança tá e a gente
  • 00:31:15
    vai fazer amostras de tamanho 100 e vai
  • 00:31:17
    construir o x Barra vai fazer um vetor
  • 00:31:19
    de X barras para n = 100 e daí a gente
  • 00:31:22
    vai fazer amostragens de novo a gente
  • 00:31:23
    quer fazer a distribuição das médias das
  • 00:31:25
    amostras né então fazemos várias
  • 00:31:27
    amostras que a gente pega aquela
  • 00:31:29
    população amostra elementos aqui tanto
  • 00:31:32
    faz botar o true ou falsa nesse caso
  • 00:31:34
    aqui é é precioso só peguei copiei colei
  • 00:31:36
    do de baixo né e e depois tira a média
  • 00:31:40
    dessa amostra e fazemos o histograma dos
  • 00:31:43
    nossos x Barra a média das das nossas
  • 00:31:46
    10.000 amostras ficou bem mais magrinha
  • 00:31:49
    ali né deu para ver que saiu do desvio
  • 00:31:51
    padrão 15 foi pro desvio padrão o quê
  • 00:31:53
    1,5 né né então tá funcionando e depois
  • 00:31:56
    a gente procura ó onde que o x Barra é
  • 00:31:58
    maior ou igual a a a 104 tá tudo aqui
  • 00:32:01
    deu false né É raro achar um true aí ó
  • 00:32:04
    tem um true aqui tem um true aqui né De
  • 00:32:07
    vez em quando o o ao acaso né acontece
  • 00:32:10
    de ser maior ou igual a 104 então isso
  • 00:32:14
    aqui a gente tem um vetor de True ou
  • 00:32:15
    false e agora a gente pode fazer uma
  • 00:32:18
    média desse vetor de True ou false que é
  • 00:32:20
    uma coisa feia mas que funciona tá então
  • 00:32:23
    imaginar que o true é um e o false é
  • 00:32:25
    zero Então você faz uma média de zeros e
  • 00:32:27
    um né então assim aqui a gente tem essa
  • 00:32:30
    esse vetor de TR false Mas se a gente
  • 00:32:32
    faz uma média disso a gente chega na no
  • 00:32:35
    valor de probabilidade quando você tinha
  • 00:32:37
    feito a conta no na unha ou pelo teorema
  • 00:32:40
    dado do limite dava lá o 0.4% e aqui deu
  • 00:32:43
    lá o 0.4% também tá então a gente
  • 00:32:45
    consegue resolver isso aqui e ver que
  • 00:32:46
    isso aqui acontece de fato se a gente
  • 00:32:48
    tem uma população desse tamanho e faz
  • 00:32:50
    amostras ao acaso ali olha as médias a
  • 00:32:54
    gente procura quando que aquela média
  • 00:32:56
    deu maior do que 104 e aparece
  • 00:32:58
    exatamente aquele valor previsto pela
  • 00:33:01
    teoria lindo demais né funciona você faz
  • 00:33:05
    uma amostra só de 100 crianças vamos
  • 00:33:07
    pegar uma amostra vou pegar esse caso
  • 00:33:08
    aqui vamos supor que a gente pega uma
  • 00:33:11
    amostra aqui né amostrou nossa população
  • 00:33:14
    sem elementos pum e daí eu calculo a
  • 00:33:18
    minha média dessa amostra deu 99 já
  • 00:33:22
    sabia que ia dar perto né e eu desvio o
  • 00:33:25
    padrão calculo o desvio padrão da minha
  • 00:33:26
    amostra me deu 16 eu sei que meuu
  • 00:33:29
    estimador é não enviesado minha amostra
  • 00:33:31
    tem um tamanho grande né então eu tenho
  • 00:33:33
    uma estimativa muito boa da minha média
  • 00:33:35
    e meu desvio do meu desvio padrão n Eu
  • 00:33:37
    sabia que lá era era 1115 né mas eu fiz
  • 00:33:40
    uma amostra e deu bom né deu 99.74 e
  • 00:33:43
    16.4 olhando essa média e esse desvio
  • 00:33:46
    padrão sabendo que meu n é tanto isso
  • 00:33:48
    aqui eu faço a minha raiz quadrada do
  • 00:33:50
    tamanho do meu n né que é que se aí olha
  • 00:33:53
    eu eu eu eu já sei que o meu desvio
  • 00:33:55
    padrão da média vai ser ao redor de 1.6
  • 00:33:59
    eu falo Nossa deve ser bem pertinho do
  • 00:34:01
    do 99.3 com um desvio padrão perto disso
  • 00:34:05
    essa ideia que tá por trás do intervalo
  • 00:34:06
    de confiança você conseguir estimar por
  • 00:34:08
    uma amostra estimar o seu Sigma e
  • 00:34:10
    estimar o seu mi e sabendo que o seu n é
  • 00:34:12
    gigante você fala olha ele vai est mais
  • 00:34:14
    ou menos por ali eu tô estimando por uma
  • 00:34:17
    amostra Como que é o desvio padrão das
  • 00:34:19
    médias das amostras olhando Uma amostra
  • 00:34:22
    consigo fazer uma previsão muito boa
  • 00:34:24
    sobre a a a média das minhas 10.000
  • 00:34:26
    amostras lá que eu tinha feito Essa é
  • 00:34:28
    ideia intervalo de confiança só tô
  • 00:34:30
    tentando construir a intuição disso e tá
  • 00:34:33
    e aqui a gente tá então resolvendo um
  • 00:34:34
    problema Um dos problemas básicos da
  • 00:34:36
    inferência estatística que é a parte de
  • 00:34:38
    estimação né eu estimo que a média da
  • 00:34:39
    minha população seja tal com o intervalo
  • 00:34:41
    de confiança tal falta ainda falar que
  • 00:34:43
    que o intervalo de confiança né a gente
  • 00:34:45
    já sabe que tem uma coisa ali que
  • 00:34:47
    acontece quando você faz uma amostra
  • 00:34:48
    grande que você fica com estimativas de
  • 00:34:51
    média tudo muito pertinho do seu
  • 00:34:53
    parâmetro mi a gente já sabe que isso
  • 00:34:55
    acontece que ele segue uma distribuição
  • 00:34:57
    normal é Sigma dividido por √ n né esse
  • 00:34:59
    eu desvio padrão centrado na média a
  • 00:35:01
    gente já sabe essas coisas todas e a
  • 00:35:03
    gente agora consegue estimar o o nosso
  • 00:35:05
    mi a gente estima pelo x Barra o nosso
  • 00:35:07
    desvio padrão da população o nosso Sigma
  • 00:35:10
    a gente estima pelo s pelo desvio padrão
  • 00:35:12
    da amostra e o nosso n a gente tem que é
  • 00:35:14
    o tamanho da nossa amostra isso aqui é
  • 00:35:15
    isso aqui é um é um número fácil né daí
  • 00:35:18
    a gente consegue fazer esse intervalo de
  • 00:35:20
    confiança eu quero fazer o intervalo de
  • 00:35:21
    confiança de 95% e daí eu coloco lá o
  • 00:35:24
    quê o x Barra eu tiro da Média da minha
  • 00:35:26
    amostra o s divido por ra do N é isso
  • 00:35:28
    aqui que a gente já tinha visto e o z a
  • 00:35:30
    gente tira daqui para conseguir ter os
  • 00:35:32
    95% Isso aqui vai ter em escala de de
  • 00:35:35
    erro padrão e daí a gente corrige esse
  • 00:35:37
    esse erro padrão pelo valor de Z Então a
  • 00:35:40
    gente vai quase dobrar aqui o
  • 00:35:42
    intervalinho de colocando 1.96 né quase
  • 00:35:45
    dobrar o intervalo do desvio padrão para
  • 00:35:47
    ter um intervalo de confiança 95% tem
  • 00:35:50
    que colocar vezes 1.96 ali tá colocando
  • 00:35:53
    esses três elementos a consegue calcular
  • 00:35:54
    o intervalo de confiança tá mas isso não
  • 00:35:56
    é o tema dessa aula de hoje não o tema
  • 00:35:58
    da aula de hoje era falar do teorema
  • 00:36:00
    central do limite
Tags
  • Lei das Médias
  • Teorema Central do Limite
  • Média Amostral
  • Desvio Padrão
  • Erros Padrão
  • Simulação Estatística
  • Distribuição Normal
  • Amostragem
  • R
  • Estatística Aplicada