Teorema Central do Limite - captando a lei natural da aleatoridade

00:36:01
https://www.youtube.com/watch?v=VeiNxBdwd2Q

Zusammenfassung

TLDRO vídeo explora a Lei das Médias e o Teorema Central do Limite por meio de simulações com lançamentos de moedas e dados. Aborda como a média amostral converge para a média populacional e como distribuições normais emergem com o aumento do tamanho da amostra. O experimento mostra que, conforme o número de lançamentos aumenta, a porcentagem de resultados se aproxima de 50%, validando a regra das grandes quantidades. A normalidade das distribuições amostrais é exemplificada e métodos estatísticos são aplicados utilizando o software R, destacando o significado do erro padrão e sua aplicação em intervalos de confiança.

Mitbringsel

  • 🎲 Lançamentos de moedas têm 50% de chance de cada resultado.
  • 📊 A média amostral se aproxima da média populacional com grandes n.
  • 📈 O tamanho da amostra impacta a normalidade da distribuição.
  • 🔍 O erro padrão é crucial na inferência estatística.
  • 📉 Distribuições de médias amostrais se tornam mais estreitas com amostras grandes.
  • 📉 A média das médias converge para o mi da população.
  • 📈 Histogramas ajudam a visualizar a normalidade das distribuição.
  • 🔄 O Teorema Central do Limite justifica a normalidade de médias amostrais.
  • �� O R é uma ferramenta poderosa para simulações estatísticas.
  • 📏 Intervalos de confiança ajudam a estimar a precisão de valores populacionais.

Zeitleiste

  • 00:00:00 - 00:05:00

    O vídeo introduz o conceito de lançamentos de moedas e como calcular a média e o desvio padrão populacional, destacando que, ao realizar 1000 lançamentos, a porcentagem de caras se aproxima de 50%.

  • 00:05:00 - 00:10:00

    Com 1000 lançamentos, é feito um gráfico acumulativo que mostra a porcentagem de caras, demonstrando a Lei das Médias, onde, à medida que o número de lançamentos aumenta, a média amostral se aproxima da média populacional.

  • 00:10:00 - 00:15:00

    O exemplo de moedas é repetido usando dados, explicando a média e o desvio padrão dessas amostras, com o desvio padrão das médias diminuindo à medida que o tamanho das amostras aumenta.

  • 00:15:00 - 00:20:00

    Histograma das distribuições de médias de amostras é apresentado, mostrando que quanto maior o tamanho da amostra, mais centrada se torna a distribuição das médias em relação à média populacional.

  • 00:20:00 - 00:25:00

    Explora a normalidade das distribuições de médias à medida que o tamanho das amostras aumenta, evidenciando a aproximação à distribuição normal, mesmo a partir de distribuições não normais.

  • 00:25:00 - 00:30:00

    O Teorema Central do Limite é discutido, que afirma que, com amostras grandes, a distribuição das médias amostrais se torna normal, independentemente da distribuição da população original.

  • 00:30:00 - 00:36:01

    Por fim, é apresentado como calcular intervalos de confiança utilizando a média das amostras e seu desvio padrão, concluindo que quanto maior a amostra, mais precisas se tornam as estimativas sobre a população.

Mehr anzeigen

Mind Map

Video-Fragen und Antworten

  • O que é a Lei das Médias?

    A Lei das Médias afirma que à medida que o tamanho da amostra aumenta, a média amostral se aproxima da média populacional.

  • Como a normalidade da distribuição é alcançada?

    Com o aumento do tamanho da amostra, as distribuições de médias amostrais tendem a se tornar mais normais.

  • O que é o Teorema Central do Limite?

    É um princípio que afirma que a distribuição das médias amostrais se aproxima de uma distribuição normal, independentemente da forma da população, quando o tamanho da amostra é suficientemente grande.

  • Qual é a relação entre a média e o desvio padrão das amostras?

    A média das amostras se aproxima da média populacional e o desvio padrão das amostras diminui à medida que o tamanho da amostra aumenta.

  • O que é erro padrão?

    O erro padrão é o desvio padrão da média amostral, calculado como o desvio padrão populacional dividido pela raiz do tamanho da amostra.

Weitere Video-Zusammenfassungen anzeigen

Erhalten Sie sofortigen Zugang zu kostenlosen YouTube-Videozusammenfassungen, die von AI unterstützt werden!
Untertitel
pt
Automatisches Blättern:
  • 00:00:04
    lançamentos de moedas que a gente vai
  • 00:00:06
    trabalhar agora é com a moeda hest e ela
  • 00:00:08
    pode dar Cara ou Coroa 50% cada ou seja
  • 00:00:11
    esse é o nosso histograma da nossa
  • 00:00:12
    população e a gente consegue computar a
  • 00:00:14
    média populacional usando aquela equação
  • 00:00:17
    inha que a gente já tá habituado a média
  • 00:00:19
    mi da população é meio e a gente pode
  • 00:00:21
    calcular também o desvio padrão
  • 00:00:23
    populacional Raí da variância variância
  • 00:00:25
    daquelas dividida por n né desv o padrão
  • 00:00:27
    populacional Sigma é meio agora a gente
  • 00:00:30
    vai fazer uma demonstração da Lei das
  • 00:00:32
    médias usando moedas e a gente vai fazer
  • 00:00:34
    1000 lançamentos então é uma amostra com
  • 00:00:37
    essa nossa população zer e 1 com
  • 00:00:40
    reposição você sempre joga a moeda
  • 00:00:41
    sempre pode tirar Cara ou Coroa a cada
  • 00:00:43
    lançamento daí você gera um vetor cara
  • 00:00:46
    que tem 1000 valores né 0 1 0 0 vai
  • 00:00:49
    aleatório esses valores zeros e uns
  • 00:00:51
    imagina que esses lançamentos são
  • 00:00:52
    sequenciais e você pode computar a
  • 00:00:54
    porcentagem acumulada a cada lançamento
  • 00:00:57
    dividindo soma acumulada pelo número de
  • 00:00:59
    lançamentos e computar então a soma
  • 00:01:00
    acumulada né então aqui se fizesse a
  • 00:01:02
    soma acumulada daria um continuaria um
  • 00:01:03
    continuaria um agora do 3 continuaria 3
  • 00:01:06
    4 5 6 7 só tô fazendo essa soma
  • 00:01:08
    acumulada e dividindo pelo número de
  • 00:01:10
    lançamentos com isso eu chego numa
  • 00:01:11
    porcentagem de caras a do do do primeiro
  • 00:01:14
    lançamento até aquele instante e depois
  • 00:01:16
    eu tô plotando isso lançamentos pela
  • 00:01:18
    porcentagem Eu quero um gráfico de linha
  • 00:01:20
    vermelho com uma linha grossa grossura
  • 00:01:22
    dois quero escrever lançamento como
  • 00:01:24
    Label do eixo X no Label do eixo Y eu
  • 00:01:27
    vou falar porcentagem de caras eu quero
  • 00:01:30
    que o gráfico tenha todo o Range de
  • 00:01:32
    lançamentos né então de 1 a 1000 e os
  • 00:01:34
    limites no Y eu quero que seja de zero a
  • 00:01:36
    1 e pum Cheguei nesse gráfico na
  • 00:01:38
    primeira vez deu cara né depois deu
  • 00:01:40
    coroa coroa caiu num terç né de
  • 00:01:42
    probabilidade depois começou a dar cara
  • 00:01:44
    de novo e depois volta paraa coroa e
  • 00:01:46
    depois e e quando vai fazendo esses
  • 00:01:48
    vários vários e vários lançamentos o que
  • 00:01:50
    acontece é que vai chegando mais e mais
  • 00:01:51
    perto de 50% né a porcentagem de caras
  • 00:01:54
    vai ficando cada vez mais próxima de 50%
  • 00:01:56
    E se eu faço isso várias vezes isso
  • 00:01:58
    acontece com uma regularidade extrema
  • 00:02:00
    tem aquele vermelhinho que a gente já
  • 00:02:01
    tinha feito antes mais outros 10 quase
  • 00:02:03
    todos caíram 50% bem bonitinho lá Essa é
  • 00:02:06
    a lei das médias né então quando você
  • 00:02:08
    tem um n Grande a média da sua amostra
  • 00:02:10
    se aproximar ao mi então a medida que o
  • 00:02:12
    n aumenta o número médio de cara se
  • 00:02:14
    aproxima mais e mais da Média
  • 00:02:15
    populacional e a média amostral x Barra
  • 00:02:18
    né converge pro parâmetro mi é um outro
  • 00:02:21
    jeito de falar a mesma coisa né esses x
  • 00:02:23
    Barras com n pequeno el geram uma
  • 00:02:25
    distribuição mais larga mais dispersa
  • 00:02:27
    mas quando você tem o seu n gigante as
  • 00:02:29
    suas médias ficam muito mais centradas
  • 00:02:31
    no Mi essa é a lógica básica que a gente
  • 00:02:33
    vai ver agora mas a gente vai ver isso
  • 00:02:35
    em diferentes exemplos Vamos retomar
  • 00:02:37
    esse exemplo da moeda que tem uma média
  • 00:02:39
    mi meio Sigma meio e agora a gente vai
  • 00:02:42
    fazer os histogramas dessas
  • 00:02:44
    distribuições de médias quando eu faço
  • 00:02:46
    N1 eu faço amostras de N1 e tiro a média
  • 00:02:50
    a média só vai poder ser zero e 1 Então
  • 00:02:52
    vai manter o mesmo formato da
  • 00:02:54
    distribuição original da população e eu
  • 00:02:56
    chego no nos mesmos valores né do da
  • 00:02:58
    média de X bar e do desvio de X barra
  • 00:03:01
    mas isso aí é desinteressante né vou
  • 00:03:02
    fazer com n maior a média de x Barra que
  • 00:03:05
    continua no 05 só que o desvio ficou um
  • 00:03:09
    pouquinho menor e repetindo essa
  • 00:03:11
    simulação de amostragem com tamanhos de
  • 00:03:14
    amostra de 4 9 e 25 observamos que a
  • 00:03:18
    média das médias das 5000 amostras
  • 00:03:20
    sempre fica bem perto do
  • 00:03:23
    0,5 Ou seja a média dos X Barras é
  • 00:03:26
    sempre no mid da população já O desvio
  • 00:03:30
    padrão das médias dessas 5000 amostras
  • 00:03:33
    fica cada vez menor conforme aumentamos
  • 00:03:35
    os tamanhos das amostras e outra coisa
  • 00:03:38
    interessante é que quanto maior é o
  • 00:03:40
    tamanho da amostra mais o formato da
  • 00:03:43
    distribuição dos xbar se aproxima do
  • 00:03:45
    formato de galciana ou seja quanto maior
  • 00:03:48
    o tamanho da amostra mais normal fica a
  • 00:03:50
    distribuição e eu vou plotar aqui agora
  • 00:03:54
    Como que essa média está ao longo desses
  • 00:03:56
    vários tamanhos aqui eu fui de 1 a 400 e
  • 00:03:58
    a média dos Barras fica sempre lá no
  • 00:04:01
    meio já O desvio ele cai dessa forma
  • 00:04:04
    aqui tá então aqui cada pontinho é cada
  • 00:04:07
    um dos experimentos que eu fiz e eu
  • 00:04:09
    juntei uma linha vermelha ali mostrando
  • 00:04:10
    como é que é a função que relaciona uma
  • 00:04:12
    coisa a outra Ok moeda Vamos fazer outra
  • 00:04:15
    coisa Super Criativa que estatístico
  • 00:04:17
    adora dado né então vamos fazer
  • 00:04:19
    experimento agora com os dados os dados
  • 00:04:20
    tem seis lados é um dado honesto todos
  • 00:04:23
    com a mesma chance a média mi é 3,5
  • 00:04:26
    certo é o centro de massa aqui no 3,5 eu
  • 00:04:29
    posso botar um que ele vai ficar
  • 00:04:30
    equilibrado e o desvio padrão é 1,71 só
  • 00:04:33
    aplicar aquela mesma fulaz inha lá você
  • 00:04:35
    chega nesse Sigma desvio padrão da
  • 00:04:37
    população de 1.71 eu vou fazer a mesma
  • 00:04:40
    brincadeira né Fazer a distribuição das
  • 00:04:42
    médias de 5000 amostras tiro uma amostra
  • 00:04:45
    tiro a média e vou colocando na minha
  • 00:04:46
    tabelinha lá depois eu faço um
  • 00:04:47
    histograma então com N1 eu chego nos
  • 00:04:49
    mesmos valores né deu quase 3,5 desvio
  • 00:04:52
    com 71 e faço com n2 continuou a mesma
  • 00:04:55
    média desvio padrão começa a diminuir e
  • 00:04:57
    começa a mudar a forma né dessa
  • 00:04:59
    distribuição e com n4 menor desvio ainda
  • 00:05:02
    vai surgindo a normal vai surgindo a
  • 00:05:04
    normal tá então com n25 aqui eu tenho a
  • 00:05:07
    minha média a média do x Barra muito
  • 00:05:09
    próximo do Inicial e o desvio do X barra
  • 00:05:12
    e em em 0,37 né que é mais ou menos 1/5
  • 00:05:15
    de 1.71 E tá lá de novo aquela mesma
  • 00:05:18
    coisa que a gente tinha visto a média
  • 00:05:20
    sempre centrada no meio da população e o
  • 00:05:22
    desvio caindo caindo caindo com aquele
  • 00:05:25
    formato de curva igual que a gente tinha
  • 00:05:26
    visto pra moeda mas ISO eu trabalhar com
  • 00:05:28
    uma distribuição normal tem um monte de
  • 00:05:30
    coisa no mundo que que a população Segue
  • 00:05:33
    uma distribuição normal coloquei uma
  • 00:05:34
    droga queria ver se mudava alguma coisa
  • 00:05:36
    na expressão gên vamos supor que a
  • 00:05:38
    população é acima do 3,5 mas na média
  • 00:05:41
    sobe a expressão daquele daquele
  • 00:05:44
    determinado gene em 35% isso poderia
  • 00:05:47
    valer para oscilações da bolsa sei lá
  • 00:05:49
    pega todas as empresas quanto que as
  • 00:05:50
    ações da bolsa variaram Naquele dia
  • 00:05:52
    quando você tem muitos efeitos juntos
  • 00:05:54
    você tem muitos fatores né a economia é
  • 00:05:56
    uma coisa complexa assim como o Genoma é
  • 00:05:58
    uma coisa complexa depende da
  • 00:05:59
    temperatura Depende de outros gênes que
  • 00:06:01
    estão lá então eh todas essas coisas
  • 00:06:03
    juntas tendem a fazer surgir uma
  • 00:06:05
    distribuição que já Segue uma cara
  • 00:06:07
    normal então é uma coisa que muitas
  • 00:06:09
    vezes acontece tem várias distribuições
  • 00:06:10
    que são normais tem várias que também
  • 00:06:12
    não são mas essa é é uma distribuição
  • 00:06:14
    comum de encontrar na natureza e eu fiz
  • 00:06:15
    uma distribuição aqui com média 3,5 e
  • 00:06:18
    Sigma 1.71 você vê que é mesmo é o mesmo
  • 00:06:21
    mi e o mesmo Sigma da anterior né só
  • 00:06:24
    mudei a cara aqui né que antes aqui era
  • 00:06:25
    uma distribuição uniforme discreta só
  • 00:06:28
    podia ter um valor 1 2 3 4 5 6 e agora
  • 00:06:30
    eu peguei uma distribuição contínua que
  • 00:06:32
    os valores podem ficar até negativos
  • 00:06:34
    muito mais positivos do que seis né
  • 00:06:36
    então mudou o Range mudou tudo mantendo
  • 00:06:38
    o mesma média e o mesmo desvio padrão tá
  • 00:06:40
    isso aqui eu fiz no R né Eu só coloquei
  • 00:06:42
    lá minha população é igual a 3,5 mais
  • 00:06:45
    1.71 rnorm de 10.000 né então esse R
  • 00:06:49
    norme vai gerar 10.000 números
  • 00:06:51
    aleatórios com média zero e desvio 1
  • 00:06:53
    isso aqui é que o r faz de fábrica média
  • 00:06:56
    zero mi z0 e Sigma 1 né des o padrão um
  • 00:06:59
    e eu só multiplico esses valores que
  • 00:07:01
    estão centrados em zero com com
  • 00:07:03
    distância média 1 eu multiplico por 1.71
  • 00:07:07
    agora a distância média vai ficar em
  • 00:07:09
    1.71 depois eu desloco essa distribuição
  • 00:07:11
    né a invés de o centro ficar no zero eu
  • 00:07:14
    desloco ele pro 3,5 então eu fiz uma
  • 00:07:16
    população e depois eu só fiz o
  • 00:07:17
    histograma dela desse jeito que eu queri
  • 00:07:19
    essa população com média 3,5 e desvio o
  • 00:07:21
    padrão
  • 00:07:22
    1.71 Mas enfim vamos lá el tem essa
  • 00:07:25
    Distribuição e vamos fazer aquele mesmo
  • 00:07:26
    experimento de 5000 amostras de
  • 00:07:28
    diferentes tamanos tamanhos aqui com N1
  • 00:07:31
    bate com que a gente já tinha visto É
  • 00:07:32
    uma boa estimativa do mi Sigma da
  • 00:07:34
    população e com n2 continua normal o
  • 00:07:37
    desvio padrão vai diminuindo quando eu
  • 00:07:38
    aumento o n o desvio padrão vai ficando
  • 00:07:39
    cada vez menor cada vez mais estreito a
  • 00:07:42
    média do x Barra não varia com o tamanho
  • 00:07:45
    do n mas o O desvio padrão do X bar cai
  • 00:07:48
    cai bastante né O que que você tira a
  • 00:07:51
    partir disso né então quando você faz
  • 00:07:53
    uma amostra grande de uns 25 elementos
  • 00:07:55
    por exemplo você sabe que o seu x Barra
  • 00:07:58
    ele não vai cair num lugar muito extremo
  • 00:08:00
    ele vai cair muito perto da sua média de
  • 00:08:02
    fato porque o desvio padrão da
  • 00:08:04
    distribuição das médias quando você faz
  • 00:08:06
    uma simulação você vê que os valores de
  • 00:08:09
    cada x Barra individualmente eles sempre
  • 00:08:12
    caem perto do do do mi original desvio
  • 00:08:13
    padrão cai muito quando você aumenta o n
  • 00:08:15
    tá você tem um erro ali claro que é
  • 00:08:17
    proporcional ao desvio do x Barra
  • 00:08:19
    daquele tamanho de amostra Considerando
  • 00:08:21
    o Sigma da população mas se você faz uma
  • 00:08:24
    amostra e estima uma amostra só você
  • 00:08:27
    estima O desvio padrão ali e você estima
  • 00:08:30
    o x Barra ali com o tamanho da sua
  • 00:08:32
    amostra você já sabe olha ela tá perto
  • 00:08:34
    proporcional ao desvio padrão que eu
  • 00:08:36
    consegui estimar e proporcionar o
  • 00:08:37
    tamanho da minha amostra tá esse é o
  • 00:08:40
    fundamento né da Lei das médias que é o
  • 00:08:42
    fundamento depois a gente vai ver aí do
  • 00:08:43
    do intervalo de confiança tá mas esse
  • 00:08:46
    experimento que a gente fez aqui essa
  • 00:08:47
    simulação que a gente fez aqui mostrando
  • 00:08:49
    que existe uma maior dispersão com com
  • 00:08:51
    tamanho de amostra Pequeno e Menor
  • 00:08:53
    dispersão com tamanho de amostra grande
  • 00:08:55
    é o teorema central do limite e o
  • 00:08:57
    teorema central do limite Na verdade tem
  • 00:08:58
    esse aspecto da redução do desvio padrão
  • 00:09:00
    Mas ele também tem Esse aspecto de gerar
  • 00:09:04
    uma distribuição que segue o formato de
  • 00:09:07
    uma normal quando você tava trabalhando
  • 00:09:09
    com as moedas ou com a média dos valores
  • 00:09:11
    dos dados ela demorava um pouquinho para
  • 00:09:13
    ficar normal Mas quando você vai
  • 00:09:15
    aumentando n você faz com que a
  • 00:09:17
    distribuição das médias x bar siga uma
  • 00:09:19
    distribuição normal esse é um aspecto
  • 00:09:21
    importante do teorema central do limite
  • 00:09:22
    né então que é emergência de uma
  • 00:09:24
    distribuição normal mesmo quando a
  • 00:09:26
    população não é normalmente distribuída
  • 00:09:29
    né então aqui aqui era uma distribuição
  • 00:09:31
    normalmente distribuída Mas mesmo quando
  • 00:09:32
    não era quando era aquela história do
  • 00:09:34
    dado a distribuição normal também surgia
  • 00:09:36
    eí aquele outro lance né de que muitas
  • 00:09:38
    das das populações muitas das medidas na
  • 00:09:40
    natureza são normalmente distribuídas ou
  • 00:09:43
    aproximadamente normais então além de
  • 00:09:45
    ter essa questão de surgir a curva
  • 00:09:47
    normal você tem também que o a média do
  • 00:09:49
    x Barra continua sendo umida a população
  • 00:09:52
    e o desvio padrão das médias amostrais
  • 00:09:54
    diminuem seguindo essa equação Sigma
  • 00:09:58
    dividido por √
  • 00:09:59
    com N1 você vai ter um desvio padrão das
  • 00:10:02
    médias que é 1/1 do Sigma da população
  • 00:10:06
    Esses são os elementos que a gente tem
  • 00:10:07
    que a média do X Barras se aproxima
  • 00:10:09
    muito bem do mi se desvio padrão do X
  • 00:10:11
    Barras se aproxima muito do Sigma
  • 00:10:14
    dividido pela ra n e esse é o teorema
  • 00:10:16
    central do limite e esse aqui vocês já
  • 00:10:18
    devem ter visto falar né Sigma dividido
  • 00:10:20
    por √ n é o erro padrão tá é o erro
  • 00:10:24
    padrão Ou desvio o padrão da Média né
  • 00:10:25
    faz todo sentido eu desvio o padrão da
  • 00:10:27
    Média que você pensa que existe uma
  • 00:10:28
    distribuição da das médias e essa
  • 00:10:30
    distribuição das médias tem um desvio
  • 00:10:32
    padrão que é dado por esse valor vamos
  • 00:10:34
    ver no R rapidinho como que foi feito
  • 00:10:36
    isso aqui é só para revisar vamos rodar
  • 00:10:38
    linha a linha isso aqui é para limpar
  • 00:10:39
    todas as variáveis a gente definiu a
  • 00:10:41
    nossa população aqui a gente consegue
  • 00:10:43
    definir aquelas outras populações a
  • 00:10:44
    gente volta aqui pro script para rodar
  • 00:10:45
    essas coisas o histograma da população
  • 00:10:48
    com os limites no x que são os limites
  • 00:10:51
    da população numa cor cinza os Breaks
  • 00:10:55
    desse histograma né onde que eu vou
  • 00:10:56
    cortar cada categoria do histograma vai
  • 00:10:58
    seguir essa regra aqui né então que ele
  • 00:11:00
    vai do valor mínimo da população até o
  • 00:11:02
    valor máximo da população dividindo em
  • 00:11:05
    30 pedaços e do mesmo tamanho né E tá aí
  • 00:11:08
    desenhado o histograma nosso grafic a
  • 00:11:11
    nossa população e depois a gente extrai
  • 00:11:13
    a média nossa média é meio nosso desvio
  • 00:11:16
    padrão aqui a gente tem que fazer na mão
  • 00:11:18
    né a gente não pode usar o sd se fizesse
  • 00:11:20
    o sd da população Paria 07 né o sd ele
  • 00:11:25
    sempre coloca o n-1 lá embaixo o r é
  • 00:11:27
    para trabalhar com amostras né para
  • 00:11:28
    trabalhar com mundo real ali então ele
  • 00:11:30
    já vem preparado para fazer desvio
  • 00:11:32
    padrão de amostra só clico o F1 em cima
  • 00:11:34
    dele ele vai aparecer aqui Standard
  • 00:11:36
    deviation aqui ó com uma variância isso
  • 00:11:39
    aqui usa o denominador n - 1 mas a gente
  • 00:11:42
    quer fazer o Sigma né então a gente tem
  • 00:11:43
    que fazer na mão e o nosso Sigma não é
  • 00:11:45
    07 ele é meio também vamos fazer a nossa
  • 00:11:47
    simulação para 25 elementos vou criar um
  • 00:11:50
    vetor onde vou onde vou salvar os meus
  • 00:11:52
    valores de x Barra e vou fazer minhas
  • 00:11:54
    5000 amostragens para cada amostragem
  • 00:11:56
    então vou fazer amostragem um né mostr
  • 00:11:59
    agem um aí eu vou procurar na minha
  • 00:12:02
    população que tem 0 e 1 25 elementos e
  • 00:12:05
    faço isso com reposição e daí ele me
  • 00:12:07
    gera lá um vetor de zeros e uns isso
  • 00:12:09
    aqui eu vou chamar de minha amostra toda
  • 00:12:11
    vez que eu seleciono aqui eu colo uma
  • 00:12:12
    linha eu tô dando control enter só para
  • 00:12:14
    relembrar a aí tiro a média dessa
  • 00:12:16
    amostra e eu tô associando isso ao x
  • 00:12:18
    Barra na posição um eu faço isso lá
  • 00:12:20
    minhas 5000 vezes né vou rodar rodar de
  • 00:12:23
    novo ele vai rodar a mostragem um de
  • 00:12:24
    novo e já tá aí lá agora el tem um x
  • 00:12:26
    Barra com um montão de valores fizemos o
  • 00:12:28
    histograma na mesma lógica lá que a
  • 00:12:30
    gente tinha feito antes tá lá o meu
  • 00:12:31
    histograma do x Barra a média no meu x
  • 00:12:34
    Barra deu 05 né então que é perto do meu
  • 00:12:36
    Mi tá batendo e o desvio padrão do x
  • 00:12:39
    Barra deu
  • 00:12:41
    0.099 que eu imagino que seja o quê o
  • 00:12:44
    nosso Sigma dividido pelo pela raiz
  • 00:12:46
    quadrada né do n né então n elevado a me
  • 00:12:50
    Então o que eu esperava era que desse 01
  • 00:12:52
    deu
  • 00:12:53
    0.999 a gente conseguiu chegar bem no
  • 00:12:55
    que a teoria diz sobre aleatoriedade né
  • 00:12:57
    então eu quero fazer essa brincadeira de
  • 00:12:59
    amostragem para tamanho de amostra 1 2 3
  • 00:13:02
    4 falei que meus n estão num vetor né
  • 00:13:04
    nvec né vetor de de tamanho de amostra e
  • 00:13:07
    para cada tamanho de amostra eu vou
  • 00:13:10
    colocar um valor de média e um valor de
  • 00:13:12
    desvio então eu vou criar vetores onde
  • 00:13:14
    eu vou salvar a média dos X Barras e o
  • 00:13:16
    desvio dos X Barras e daí eu vou rodar
  • 00:13:19
    um loop aqui o loop que ele vai rodar
  • 00:13:21
    essa variável count do valor um até o
  • 00:13:24
    tamanho do vetor de nes né vetor de nes
  • 00:13:27
    tem 14 elementos então meu o count vai
  • 00:13:29
    de 1 a 14 então quando eu rodo o count
  • 00:13:31
    na primeira vez ele já computa todo
  • 00:13:34
    aquele eu preciso fazer um count aqui
  • 00:13:36
    count igual a um vai fazer amostragem
  • 00:13:39
    aqui a primeira amostragem que ele vai
  • 00:13:40
    fazer vamos falar amostragem igual a 1 a
  • 00:13:43
    primeira amostragem ele vai criar uma
  • 00:13:45
    amostra daquela população com o nvec
  • 00:13:48
    daquela posição da posição um né o count
  • 00:13:50
    é um o nvec que a gente vai caçar
  • 00:13:52
    primeiro é um né esse valor aqui e vai
  • 00:13:55
    fazer com reposição Então tá lá a nossa
  • 00:13:57
    amostra de um elemento
  • 00:14:01
    né E quando você pede a média de uma
  • 00:14:03
    amostra de um elemento ela retorna
  • 00:14:04
    aquele valor mesmo e tá salvando isso no
  • 00:14:06
    nosso x bar amostragem a gente faz isso
  • 00:14:08
    aqui das nossas 5000 vezes e depois tira
  • 00:14:11
    a média dos X Barras tá e desvio o
  • 00:14:13
    padrão do X Barras tá vamos rodar esse
  • 00:14:16
    treco inteiro aqui então agora a gente
  • 00:14:19
    tem um uma média x Barra para cada um
  • 00:14:22
    desses valores de tamanho de amostra
  • 00:14:24
    sempre aqui no meio né E aqui um desvio
  • 00:14:27
    padrão do X bar para cada tamanho dessas
  • 00:14:29
    amostras também e aí você vê caindo né e
  • 00:14:32
    agora a gente só plota né o tamanho pela
  • 00:14:34
    média exp plotamos os nossos valores de
  • 00:14:37
    média então tamanho de amostra no x a
  • 00:14:39
    média dos 5000 x Barras né Para aqueles
  • 00:14:41
    tamanhos de amostra no Y aí o que eu
  • 00:14:43
    quero fazer também é plotar um outro
  • 00:14:45
    gráfico por cima desse segura o gráfico
  • 00:14:47
    que eu quero plotar coisa por cima né
  • 00:14:49
    daí você roda esse esse comando aqui par
  • 00:14:51
    New iG true e o que eu pedi para colocar
  • 00:14:53
    lá foi para todo aquele meu Range de de
  • 00:14:56
    m para ele escrever o meu Mi no o valor
  • 00:14:59
    X1 para o y5 e o outro ponto é
  • 00:15:03
    x400 para y52 também então ele desenhou
  • 00:15:06
    essa linha né tipo é linha a cor é
  • 00:15:09
    vermelho eu falo para ele plotar
  • 00:15:11
    exatamente o mesmo xlink que já tava o
  • 00:15:13
    mesmo Y link que já tava né e eu falo Ah
  • 00:15:17
    não plota De novo sen não fica feio
  • 00:15:18
    depois que a gente plotou as médias
  • 00:15:20
    vamos plotar os desvios né que a mesma
  • 00:15:23
    coisa o mesmo caminho só que a gente
  • 00:15:25
    mudou a variável a gente vai colocar o
  • 00:15:26
    desvio x bar o primeiro gráfico é só dos
  • 00:15:28
    pontinhos né Olha só o segundo gráfico o
  • 00:15:31
    que que é é o Sigma dividido pela raiz
  • 00:15:35
    do n o gráfico em vermelho já é o que a
  • 00:15:38
    teoria diz pra gente o teorema central
  • 00:15:40
    do limite né E você vê que cai bem um
  • 00:15:43
    bem em Cinha do outro mesmo né e a gente
  • 00:15:45
    pode checar se esse caiu bem em Cinha do
  • 00:15:47
    outro faz uma razão entre o desvio x
  • 00:15:49
    Barra e o que a teoria o teorema citado
  • 00:15:52
    do limite diz paraa gente se der um
  • 00:15:54
    exatamente em cima do outro tem que dar
  • 00:15:56
    quanto um certo você pode tá dando
  • 00:15:59
    exatamente o um aqui né então você pode
  • 00:16:02
    rodar e olhar os valores que deram né
  • 00:16:04
    tudo valor muito próximo de um né eu
  • 00:16:06
    posso fazer o gráfico agora plota aqui
  • 00:16:08
    as razões e plota a linha né A constante
  • 00:16:11
    um só para mostrar que tá funcionando
  • 00:16:13
    para todos os casos muito bem né Tá
  • 00:16:15
    fizemos esse primeiro caso eu só quero
  • 00:16:17
    rodar agora paraa população de dados
  • 00:16:20
    pron tá aqui o histograma da população
  • 00:16:23
    tem 1 2 3 4 5 6 parece uma distribuição
  • 00:16:26
    inha normal bonitinho fáil aquele mesmo
  • 00:16:28
    ento pros diferentes tamanhos de amostra
  • 00:16:30
    né plotas médias tudo no 3,5 o mid dado
  • 00:16:35
    o desvio padrão cai bem em Cinha do
  • 00:16:37
    Sigma dividido por ra n quando eu faço
  • 00:16:40
    aquela razão entre desvio e Sigma tá
  • 00:16:43
    tudo em cima do um funciona igualzinho o
  • 00:16:45
    outro caso aqui só fazendo de novo
  • 00:16:49
    mostrando que funciona né aqui nossa
  • 00:16:51
    população o mi e o Sigma né novo aquele
  • 00:16:54
    experimento de amostragem com 25
  • 00:16:56
    elementos a gente vê que fica muito mais
  • 00:16:57
    magrinha normal né o Sigma da população
  • 00:17:00
    dividido pela raiz do n e dividido por 5
  • 00:17:03
    né que o nosso n é 25 Sigma er 0.7 o
  • 00:17:06
    padrão 03 S vamos dividir o Sigma pelo
  • 00:17:08
    des padrão tem que dar cinco percebeu aí
  • 00:17:10
    5.03 então exatamente o que teia disso
  • 00:17:12
    sonica Maravilha
  • 00:17:13
    is funa Maravilha tá a média sempre no
  • 00:17:16
    no valor que tinha colocado desvio desir
  • 00:17:18
    n e e a razão sempre um chega de R um
  • 00:17:21
    pouquinho Tera central do limite
  • 00:17:23
    distribuição das médias Segue uma
  • 00:17:24
    distribuição normal que tem dois
  • 00:17:26
    parâmetros um parâmetro média que ele
  • 00:17:28
    cai em cima do mi e um parâmetro desvio
  • 00:17:31
    padrão que cai em cima do Sigma da
  • 00:17:33
    população dividido pela raiz do e e
  • 00:17:35
    porque raiz esse nome né teorema central
  • 00:17:37
    do limite o Central se refere a
  • 00:17:39
    fundamental ele tá como ele é base para
  • 00:17:42
    fazer um monte de coisa n est e no
  • 00:17:43
    limite porque ele só funciona no limite
  • 00:17:46
    né quando você tem um n é grande o
  • 00:17:48
    suficiente né se você tiver um n muito
  • 00:17:50
    pequeno você não tem essa propriedade
  • 00:17:52
    fundamental válida o teorema central do
  • 00:17:54
    limite só funciona quando você tem um n
  • 00:17:56
    grande quando você tem uma distribuição
  • 00:17:58
    normal a sua população Segue uma
  • 00:17:59
    distribuição normal ele já funciona de
  • 00:18:01
    cara a distribuição das médias vai ser
  • 00:18:03
    normal mesmo que você use um n
  • 00:18:05
    ridiculamente pequeno mas quando você
  • 00:18:08
    tem uma distribuição que não segue uma
  • 00:18:09
    distribuição normal uma distribuição
  • 00:18:11
    uniforme uma distribuição bimodal enfim
  • 00:18:13
    daí você eh tem que fazer um n muito
  • 00:18:16
    maior para conseguir observar eh essa
  • 00:18:19
    emergência da normalidade a gente tá
  • 00:18:21
    vendo que ela tem uns probleminhas né
  • 00:18:22
    ela funciona no infinito tô mostrando a
  • 00:18:23
    ferramenta com problemas mas depois a
  • 00:18:25
    gente vai fazer ela ficar mais poderosa
  • 00:18:27
    ainda tá próximas aulas mas esse que é o
  • 00:18:29
    princípio básico né distribuição das
  • 00:18:30
    médias amostrais quando você tem um n
  • 00:18:33
    Grande a sua distribuição das médias
  • 00:18:34
    amostrais é sempre as mesmas é sempre
  • 00:18:36
    uma normal ou galciana d na mesma Ela
  • 00:18:38
    tem os parâmetros lá né Sigma que entra
  • 00:18:40
    aqui e aqui e ela tem o mi que entra
  • 00:18:42
    aqui aí o x que é a coisa que a gente
  • 00:18:44
    varia no eixo X né e o resto é tudo
  • 00:18:46
    número né enfim são dois parâmetros que
  • 00:18:48
    a gente tem nessa função o mi e o Sigma
  • 00:18:51
    e a gente pode usar essa escala de valor
  • 00:18:53
    bruto valor em centímetro quilo que a
  • 00:18:55
    gente mediu de fato Ou a gente pode
  • 00:18:57
    fazer uma escala em erro padrão uma
  • 00:19:00
    escala de desvio padrão da Média que
  • 00:19:02
    aqui vira o zero aí um desvio padrão da
  • 00:19:04
    média para lá e para cá essa a escala Z
  • 00:19:07
    né se vê aquela tabela Z que tem tudo
  • 00:19:09
    quanto é livro de estatística que
  • 00:19:11
    associa valores de Z que é os que estão
  • 00:19:13
    em aqui com valores de
  • 00:19:15
    probabilidade né para cada valor de Z
  • 00:19:18
    ela vai ter um valor de probabilidade e
  • 00:19:20
    num caso aqui como esse a gente pode
  • 00:19:21
    procurar agora eu quero procurar na
  • 00:19:23
    minha tabela qual que seria a
  • 00:19:24
    probabilidade Então essa área nesse
  • 00:19:27
    pedaço aqui para um Z = 0 como é que eu
  • 00:19:30
    acho isso aqui na minha tabela eu já sei
  • 00:19:31
    que isso aqui é 50% né a distribuição
  • 00:19:34
    normal é simétrica unimodal então eu sei
  • 00:19:36
    que se eu colocar lá no pico dela eu vou
  • 00:19:38
    ter meu Z = 0 isso aqui tem que dar 50%
  • 00:19:41
    tem lá na minha tabela para um z0 né 0.0
  • 00:19:45
    Na primeira casa decimal e na segunda
  • 00:19:47
    casa decimal zero também esse aqui é a
  • 00:19:49
    segunda casa decimal que tá colocado em
  • 00:19:50
    cima o 50% ele tá no
  • 00:19:54
    z0.00 e o que ele tá mostrando pra gente
  • 00:19:56
    aqui é a integral do valor de menos
  • 00:20:00
    infinito até o valor de Z essa tabela no
  • 00:20:03
    final Então ela mostra a área acumulada
  • 00:20:05
    né o integral do menos infinito até os
  • 00:20:08
    valores de z o que tem nessa tabela no
  • 00:20:11
    fundo é essa curva associando valores de
  • 00:20:14
    Z que é o que tão embaixo Aqui com
  • 00:20:16
    valores de probabilidade acumulada então
  • 00:20:18
    isso aqui é a distribuição normal com as
  • 00:20:20
    áreas essa área tem 0.1% essa área tem
  • 00:20:24
    2.1% 13.6 por 34% se você somar tudo
  • 00:20:28
    isso aqui vai dar o 50 né E se você
  • 00:20:30
    somar com o outro lado dá um né que a
  • 00:20:32
    probabilidade é sempre um sempre tem que
  • 00:20:33
    somar 100% Qual que é a área do menos
  • 00:20:35
    infinito até o -4 que estaria aqui mais
  • 00:20:38
    ou menos né -4 desvio padrão Aí é zero
  • 00:20:41
    aí ó o 3 tá no zero quase ali né mas daí
  • 00:20:44
    você vai subindo para o -2 aí ele já tem
  • 00:20:47
    2.2 e quando você chega no z0 você chega
  • 00:20:50
    na integral 50% né a área acumulada é
  • 00:20:54
    0.5 e assim você segue até chegar no
  • 00:20:56
    100% que quando você pegou ual a
  • 00:20:58
    integral do menos infinito até o 5 e é
  • 00:21:02
    isso que tá mostrado aqui nessa tabela
  • 00:21:03
    tá então essa essa área né a integral do
  • 00:21:06
    menos infinito até o valor de z eu
  • 00:21:08
    queria saber quais são os valores
  • 00:21:10
    Associados a esse 2,5 desse lado e esse
  • 00:21:13
    2,5 desse lado para ter uma área no meio
  • 00:21:15
    de 95% eu consigo achar isso nessa
  • 00:21:18
    tabela é só eu procurar Onde tá o 2,5 e
  • 00:21:21
    o 2,5 não tem porque ela começa no 50 né
  • 00:21:23
    no z0 não tem valor negativo Tá mas ela
  • 00:21:26
    é simétrica então isso não é um problema
  • 00:21:27
    eu posso procurar então o 97,5 que é o
  • 00:21:30
    2,5 daqui mais os 95 daqui tá 80 e tanto
  • 00:21:34
    90 e tanto 97,5 achei aqui ó ele tá
  • 00:21:38
    associado a qual valor de z
  • 00:21:43
    1.96 eu posso botar lá integral do menos
  • 00:21:45
    infinito até 1.96 é o
  • 00:21:48
    97,5 Mas como eu sei que isso aqui é
  • 00:21:51
    simétrico né o Men 1.96 tá por outro
  • 00:21:54
    lado ali eu só ponho um negativo para
  • 00:21:56
    ter 95% de probabilidade numa
  • 00:21:59
    distribuição normal com média zero
  • 00:22:01
    desvio padrão um eu tenho que pegar
  • 00:22:03
    entre o - 1.96 até o mais 1.96 mas isso
  • 00:22:07
    aqui cara é ano 70 raivoso assim tabela
  • 00:22:10
    horrível não queremos brincar com isso a
  • 00:22:12
    gente quer fazer isso no R né que é
  • 00:22:14
    muito mais fácil bom primeiro a gente já
  • 00:22:16
    tinha visto como é que fazia números
  • 00:22:18
    aleatórios vindo de uma distribuição
  • 00:22:19
    normal que era o r enorme aqui eu tô
  • 00:22:21
    plotando no x de 1 a 100 e aqui os ele
  • 00:22:25
    vai me dar 100 valores aleatórios que
  • 00:22:27
    vem de uma distribuição normal com média
  • 00:22:29
    zero desvio padrão um daí ele plotou
  • 00:22:31
    valores aleatórios ali você vê que é
  • 00:22:32
    mais mais pesado né Tem mais número
  • 00:22:35
    perto do um e pouquinho número acima do
  • 00:22:37
    dois não tem quase nada né Esse é para
  • 00:22:39
    gerar números aleatórios mas eu quero
  • 00:22:41
    fazer a distribuição de densidade de
  • 00:22:43
    probabilidade essa equação tá eu só
  • 00:22:46
    tenho que usar a função d norme d de
  • 00:22:48
    densidade né Eu quero fazer a função de
  • 00:22:51
    densidade de probabilidade na normal e
  • 00:22:54
    eu quero fazer isso aqui pros valores de
  • 00:22:56
    Z né valores de Z que vão de -4
  • 00:22:59
    até 4 o Sec eu posso usar o by eu posso
  • 00:23:01
    usar o length né Vocês já viram que dá
  • 00:23:03
    para usar de dois jeitos eu quero então
  • 00:23:05
    do do menos 4 até o 4 por pulinhos de 01
  • 00:23:09
    né Então isso que eu vou botar no x aqui
  • 00:23:11
    aí no Y eu vou botar o dorme desses
  • 00:23:14
    valores de x né então eu botei a mesma
  • 00:23:16
    coisa aqui aqui e daí eu tenho minha
  • 00:23:18
    distribuição normal que vai do Z - 4 até
  • 00:23:21
    o mais 4 eu podia botar mais né normal
  • 00:23:23
    vai de menos infinito até mais infinito
  • 00:23:25
    só que só tem variação aí enfim tá aí
  • 00:23:28
    desenhado a nossa função densidade de
  • 00:23:29
    probabilidade tá esse é um pedaço da
  • 00:23:32
    coisa isso aqui não é o que a tabela faz
  • 00:23:33
    né O que a tabela faz é mostrar Z e
  • 00:23:37
    probabilidade acumulada né a integral né
  • 00:23:39
    do menos infinito até o valor de Z E
  • 00:23:41
    para isso a gente usa o outro o p de
  • 00:23:42
    probabilidade né probabilidade vindo de
  • 00:23:45
    uma distribuição normal então quero a
  • 00:23:46
    função densidade de probabilidade
  • 00:23:48
    acumulada probabilidade embaixo de cada
  • 00:23:51
    ponto aqui é é nada né você não consegue
  • 00:23:53
    fazer integral de um ponto você tem que
  • 00:23:55
    colocar o intervalo né Aqui tem um
  • 00:23:56
    intervalo eu fiz aqui eu quero integral
  • 00:23:59
    do menos infinito até cada valor de Z
  • 00:24:01
    aqui colocando mesma aquela mesma
  • 00:24:03
    sequência de -4 a 4 e falando quero
  • 00:24:06
    probabilidade acumulada de menos
  • 00:24:07
    infinito até cada um desses valores aqui
  • 00:24:09
    e daí ele desenha aquela função
  • 00:24:11
    densidade de probabilidade acumulada no
  • 00:24:13
    zero dá o 50% né esse é um pedaço eu
  • 00:24:16
    quero fazer a função inversa né Ou seja
  • 00:24:18
    eu quero o quanti eu quero colocar
  • 00:24:20
    valores entre 0 e 1 né entre 0 e 100% e
  • 00:24:23
    ele vai me dar Qual que é o valor do Z
  • 00:24:25
    esse aqui então é o quanti né o q enorme
  • 00:24:28
    isso aqui é a mesma coisa que é só que
  • 00:24:29
    com os estos invertidos então eu dou um
  • 00:24:31
    valor de zero a 1 e ele me retorna Qual
  • 00:24:33
    que é o z ou seja com essas coisas todas
  • 00:24:36
    aqui eu tenho tudo que tem naquela
  • 00:24:38
    tabela só que prático é sempre legal dar
  • 00:24:41
    uma olhada nessa tabela que você pega um
  • 00:24:42
    pouco de intuição mas na hora do vamos
  • 00:24:44
    ver é R né então R enorme D enorme P
  • 00:24:47
    enorme e q enorme como é que eu
  • 00:24:49
    trabalharia naquele caso ali né então o
  • 00:24:51
    p enorme daquele Z Qual que é a
  • 00:24:53
    probabilidade de menos infinito até zero
  • 00:24:55
    50% e qual que é o quanti associado a
  • 00:24:58
    área de 50% qual que é o z associado a
  • 00:25:01
    probabilidade de 50% daí me retorna O Z
  • 00:25:03
    0 Qual que é a probabilidade associada
  • 00:25:06
    ao - 1.96 e 1.96 daí ele vai me dar lá
  • 00:25:10
    os valores de probabilidade né e o que
  • 00:25:12
    enorme Qual que é o z associado a
  • 00:25:14
    probabilidade de 2,5% e 97,5 e daele me
  • 00:25:18
    solta o quanti - 1.96 e mais 1.96 então
  • 00:25:22
    Tom aí a gente já viu que a normal é
  • 00:25:23
    importante pelo teorema central do
  • 00:25:25
    limite né sabe o formato da curva e sabe
  • 00:25:27
    os parâmetros dessa curva e a gente viu
  • 00:25:29
    que tem esse jeito de trabalhar mas é
  • 00:25:30
    sempre com uma distribuição normal
  • 00:25:32
    padrão Poxa cara eu não quero trabalhar
  • 00:25:34
    com a distribuição normal padrão né
  • 00:25:36
    alturas das pessoas a O Mi é é por volta
  • 00:25:39
    de 1,70 O desvio padrão é 15 cm mas o
  • 00:25:43
    que vocês estão me dando é uma normal
  • 00:25:44
    padrão de mi0 e Sigma 1 mas daí é só
  • 00:25:48
    transformar né multiplica primeiro pelo
  • 00:25:50
    desvio padrão e depois soma a média e
  • 00:25:52
    aqui o que a gente tem que fazer é o
  • 00:25:53
    caminho inverso pegar a distribuição
  • 00:25:55
    subtrair a média e depois dividir pelo
  • 00:25:58
    desvio padrão exatamente o processamento
  • 00:26:00
    inverso do que tá ali então a gente
  • 00:26:01
    consegue fazer de uma distribuição
  • 00:26:03
    qualquer chegar na distribuição padrão
  • 00:26:05
    por esse procedimento aqui a gente faz o
  • 00:26:06
    oposto sair de uma distribuição padrão e
  • 00:26:08
    chegar numa distribuição com a média e
  • 00:26:11
    desvio padrão de interesse pesado leve
  • 00:26:13
    tranquilo fácil Tá então vamos ver se
  • 00:26:16
    funcionou mesmo vamos usar esses zores
  • 00:26:18
    teorema central do limite vamos fazer
  • 00:26:20
    essa coisa toda vamos supor que a gente
  • 00:26:22
    saiba que a distribuição de QI é uma
  • 00:26:24
    distribuição normal com média Mi sem
  • 00:26:27
    desvio padrão Sigma 15 a população é
  • 00:26:30
    assim aí eu seleciono 100 crianças e
  • 00:26:32
    avalio os qis Qual é a chance de
  • 00:26:35
    obtermos a média da amostra 104 ou mais
  • 00:26:38
    tá então a gente tem uma população de q
  • 00:26:41
    com mi 100 Sigma 15 selecionamos um n de
  • 00:26:45
    100 crianças Qual que é a chance de
  • 00:26:47
    obter uma média da amostra 104 ou mais
  • 00:26:51
    alta né Lembrando que use score era
  • 00:26:53
    desse jeito vamos lá como é que a gente
  • 00:26:54
    faz isso primeiro a gente pega esse 104
  • 00:26:57
    que é a nossa medida ali né subtrai do
  • 00:26:59
    mi e divide pelo Sigma certo e daí a
  • 00:27:03
    gente pegou aqui então deu 4 dividido
  • 00:27:06
    pelo 15 que é o nosso Sigma e deu 0,27
  • 00:27:09
    então o nosso Z deu 0,27 é só procurar
  • 00:27:12
    na tabela onde que tá o 0,27 que dá 0,60
  • 00:27:15
    que faz o p enorme lá da função dá 0,60
  • 00:27:18
    também e depois a gente chega lá que a
  • 00:27:20
    probabilidade deu 0.4 Então pega aqui
  • 00:27:24
    aplica o valor não precisa nem pensar né
  • 00:27:27
    Tá certo isso
  • 00:27:30
    Por que que não tá
  • 00:27:32
    certo não tá certo porque a gente não tá
  • 00:27:36
    trabalhando com uma observação a gente
  • 00:27:37
    está trabalhando com 100 isso aqui a
  • 00:27:39
    gente tá colocando o Sigma que a gente
  • 00:27:41
    pegou da população o 15 a gente não usou
  • 00:27:44
    o teorema central do limite a gente não
  • 00:27:46
    botou o nosso Sigma dividido pela raiz
  • 00:27:48
    do n a gente botou só o Sigma aqui não
  • 00:27:50
    pode pegar é só aplicar fórmula né esse
  • 00:27:53
    Sigma aqui ele não é o Sigma da
  • 00:27:55
    população ele é o erro padrão o Sigma de
  • 00:27:58
    dividido pela raiz do n porque a gente
  • 00:27:59
    tá trabalhando com uma média dessas
  • 00:28:01
    várias crianças Então a gente tem que
  • 00:28:03
    pegar esse Sigma e dividir por raiz 100
  • 00:28:05
    dividir por 10 ou seja a gente tem que
  • 00:28:07
    calcular o erro padrão e depois jogar lá
  • 00:28:09
    naquele cálculo do Z Então você coloca o
  • 00:28:11
    seu 104 subtrai O Mi da população e
  • 00:28:15
    divide pelo erro padrão 1,52 e daí tá um
  • 00:28:18
    z de 2.7 e depois você procura o 2.67 e
  • 00:28:22
    daí dá o 0.99 olha só deu lá na frente
  • 00:28:25
    né 0.99 deu lá pra frente área de 9 %
  • 00:28:29
    então fazer essa continha do Z dividindo
  • 00:28:32
    pelo erro padrão e depois você calcula
  • 00:28:34
    essa área tinha visto que dá o
  • 00:28:38
    0.9962 maior do que isso é só o
  • 00:28:41
    0.4% tá então é super raro de achar uma
  • 00:28:44
    média de 100 crianças com Q igual ou
  • 00:28:48
    maior a 104 vamos rodar isso aqui no
  • 00:28:50
    resse exercício de q das crianças né
  • 00:28:52
    então limpar tudo esseo cara e quero
  • 00:28:54
    limpar aqui tá então vou fazer na unha a
  • 00:28:57
    gente viu que a tem esse mi e esse Sigma
  • 00:28:59
    certo 100 deq com Sigma 15 tá Daí a
  • 00:29:02
    gente faz uma amostra de 100 crianças
  • 00:29:05
    daí a pergunta é Qual que é a chance de
  • 00:29:07
    encontrar uma amostra desse tamanho com
  • 00:29:11
    uma média maior ou igual a 104 tá então
  • 00:29:13
    a gente tem o nosso x Barra o que a
  • 00:29:14
    gente tá perguntando é isso aqui como é
  • 00:29:16
    que a gente faz essa conta tá primeiro é
  • 00:29:18
    fazer aquele Z né que é pegar o seu x
  • 00:29:21
    Barra subtrair do Mi né então tenho aqui
  • 00:29:24
    quatro e divide pelo erro padrão que é o
  • 00:29:27
    sig dividido pela ra do
  • 00:29:29
    n então aqui deu 1,52 né então o nosso Z
  • 00:29:34
    deu
  • 00:29:35
    2.67 lá depois a gente usa a tabela ou
  • 00:29:38
    usa o r para fazer essa conta então o p
  • 00:29:41
    norme do Z é
  • 00:29:43
    0.99 da gente faz 1 menos P que daí dá
  • 00:29:46
    os 0 4% né beleza essa essa é a conta
  • 00:29:51
    para resolver aquele exercic aqui né né
  • 00:29:55
    distribuição normal com 100 15 uma m
  • 00:29:57
    amra maior ou igual 104 isso aqui é
  • 00:29:59
    fazendo na unha usando teoria né usando
  • 00:30:02
    teorema central do limite né a gente
  • 00:30:04
    pode resolver por simulação sem usar
  • 00:30:06
    teorema central do limite ele o teorema
  • 00:30:08
    central do limite sempre tá rodando por
  • 00:30:10
    no fundo né Ele é só uma um uma lei que
  • 00:30:12
    que governa a natureza né e o o e a
  • 00:30:15
    gente só que a gente não vai precisar
  • 00:30:17
    colocar aquela equação Zinha a gente
  • 00:30:18
    botou essa equação zinha aqui né a gente
  • 00:30:20
    falou olha Então tá usando tá usando seu
  • 00:30:21
    teorema central do limite taxa sabendo
  • 00:30:23
    que é uma distribuição normal por isso
  • 00:30:25
    que a gente tá colocando PME aqui porque
  • 00:30:26
    a gente sabe que isso aí que ser uma
  • 00:30:28
    distribuição normal que tem esses
  • 00:30:29
    parâmetros mi e Sigma dividido por ra de
  • 00:30:32
    n Essa é a distribuição das médias né
  • 00:30:34
    Então essa essa é o desvio padrão da
  • 00:30:36
    distribuição das médias e a gente só tá
  • 00:30:38
    vendo onde que tá aquele Z nessa
  • 00:30:40
    distribuição normal e calculando a
  • 00:30:42
    probabilidade ali mas a gente poderia
  • 00:30:44
    Não nem pensar em teorema central do
  • 00:30:46
    limite né não é mais prático Tá mas é um
  • 00:30:49
    jeito mais fácil de entender talvez tá
  • 00:30:51
    mas só para ver que isso aqui funciona
  • 00:30:53
    mesmo você não precisa o teorema Central
  • 00:30:55
    limite ele surge na tua mão população de
  • 00:30:56
    crianças lá ela tem média 100 desvio
  • 00:30:59
    padrão 15 produziu a nossa população de
  • 00:31:01
    de 100.000 crianças aqui começamos lá
  • 00:31:03
    construimos a nossa população e temos o
  • 00:31:05
    nosso histograma da nossa população tá
  • 00:31:08
    então a nossa população tem média 100 O
  • 00:31:11
    desvio padrão 15 né Então essa é a nossa
  • 00:31:13
    população de que de criança tá e a gente
  • 00:31:15
    vai fazer amostras de tamanho 100 e vai
  • 00:31:17
    construir o x Barra vai fazer um vetor
  • 00:31:19
    de X barras para n = 100 e daí a gente
  • 00:31:22
    vai fazer amostragens de novo a gente
  • 00:31:23
    quer fazer a distribuição das médias das
  • 00:31:25
    amostras né então fazemos várias
  • 00:31:27
    amostras que a gente pega aquela
  • 00:31:29
    população amostra elementos aqui tanto
  • 00:31:32
    faz botar o true ou falsa nesse caso
  • 00:31:34
    aqui é é precioso só peguei copiei colei
  • 00:31:36
    do de baixo né e e depois tira a média
  • 00:31:40
    dessa amostra e fazemos o histograma dos
  • 00:31:43
    nossos x Barra a média das das nossas
  • 00:31:46
    10.000 amostras ficou bem mais magrinha
  • 00:31:49
    ali né deu para ver que saiu do desvio
  • 00:31:51
    padrão 15 foi pro desvio padrão o quê
  • 00:31:53
    1,5 né né então tá funcionando e depois
  • 00:31:56
    a gente procura ó onde que o x Barra é
  • 00:31:58
    maior ou igual a a a 104 tá tudo aqui
  • 00:32:01
    deu false né É raro achar um true aí ó
  • 00:32:04
    tem um true aqui tem um true aqui né De
  • 00:32:07
    vez em quando o o ao acaso né acontece
  • 00:32:10
    de ser maior ou igual a 104 então isso
  • 00:32:14
    aqui a gente tem um vetor de True ou
  • 00:32:15
    false e agora a gente pode fazer uma
  • 00:32:18
    média desse vetor de True ou false que é
  • 00:32:20
    uma coisa feia mas que funciona tá então
  • 00:32:23
    imaginar que o true é um e o false é
  • 00:32:25
    zero Então você faz uma média de zeros e
  • 00:32:27
    um né então assim aqui a gente tem essa
  • 00:32:30
    esse vetor de TR false Mas se a gente
  • 00:32:32
    faz uma média disso a gente chega na no
  • 00:32:35
    valor de probabilidade quando você tinha
  • 00:32:37
    feito a conta no na unha ou pelo teorema
  • 00:32:40
    dado do limite dava lá o 0.4% e aqui deu
  • 00:32:43
    lá o 0.4% também tá então a gente
  • 00:32:45
    consegue resolver isso aqui e ver que
  • 00:32:46
    isso aqui acontece de fato se a gente
  • 00:32:48
    tem uma população desse tamanho e faz
  • 00:32:50
    amostras ao acaso ali olha as médias a
  • 00:32:54
    gente procura quando que aquela média
  • 00:32:56
    deu maior do que 104 e aparece
  • 00:32:58
    exatamente aquele valor previsto pela
  • 00:33:01
    teoria lindo demais né funciona você faz
  • 00:33:05
    uma amostra só de 100 crianças vamos
  • 00:33:07
    pegar uma amostra vou pegar esse caso
  • 00:33:08
    aqui vamos supor que a gente pega uma
  • 00:33:11
    amostra aqui né amostrou nossa população
  • 00:33:14
    sem elementos pum e daí eu calculo a
  • 00:33:18
    minha média dessa amostra deu 99 já
  • 00:33:22
    sabia que ia dar perto né e eu desvio o
  • 00:33:25
    padrão calculo o desvio padrão da minha
  • 00:33:26
    amostra me deu 16 eu sei que meuu
  • 00:33:29
    estimador é não enviesado minha amostra
  • 00:33:31
    tem um tamanho grande né então eu tenho
  • 00:33:33
    uma estimativa muito boa da minha média
  • 00:33:35
    e meu desvio do meu desvio padrão n Eu
  • 00:33:37
    sabia que lá era era 1115 né mas eu fiz
  • 00:33:40
    uma amostra e deu bom né deu 99.74 e
  • 00:33:43
    16.4 olhando essa média e esse desvio
  • 00:33:46
    padrão sabendo que meu n é tanto isso
  • 00:33:48
    aqui eu faço a minha raiz quadrada do
  • 00:33:50
    tamanho do meu n né que é que se aí olha
  • 00:33:53
    eu eu eu eu já sei que o meu desvio
  • 00:33:55
    padrão da média vai ser ao redor de 1.6
  • 00:33:59
    eu falo Nossa deve ser bem pertinho do
  • 00:34:01
    do 99.3 com um desvio padrão perto disso
  • 00:34:05
    essa ideia que tá por trás do intervalo
  • 00:34:06
    de confiança você conseguir estimar por
  • 00:34:08
    uma amostra estimar o seu Sigma e
  • 00:34:10
    estimar o seu mi e sabendo que o seu n é
  • 00:34:12
    gigante você fala olha ele vai est mais
  • 00:34:14
    ou menos por ali eu tô estimando por uma
  • 00:34:17
    amostra Como que é o desvio padrão das
  • 00:34:19
    médias das amostras olhando Uma amostra
  • 00:34:22
    consigo fazer uma previsão muito boa
  • 00:34:24
    sobre a a a média das minhas 10.000
  • 00:34:26
    amostras lá que eu tinha feito Essa é
  • 00:34:28
    ideia intervalo de confiança só tô
  • 00:34:30
    tentando construir a intuição disso e tá
  • 00:34:33
    e aqui a gente tá então resolvendo um
  • 00:34:34
    problema Um dos problemas básicos da
  • 00:34:36
    inferência estatística que é a parte de
  • 00:34:38
    estimação né eu estimo que a média da
  • 00:34:39
    minha população seja tal com o intervalo
  • 00:34:41
    de confiança tal falta ainda falar que
  • 00:34:43
    que o intervalo de confiança né a gente
  • 00:34:45
    já sabe que tem uma coisa ali que
  • 00:34:47
    acontece quando você faz uma amostra
  • 00:34:48
    grande que você fica com estimativas de
  • 00:34:51
    média tudo muito pertinho do seu
  • 00:34:53
    parâmetro mi a gente já sabe que isso
  • 00:34:55
    acontece que ele segue uma distribuição
  • 00:34:57
    normal é Sigma dividido por √ n né esse
  • 00:34:59
    eu desvio padrão centrado na média a
  • 00:35:01
    gente já sabe essas coisas todas e a
  • 00:35:03
    gente agora consegue estimar o o nosso
  • 00:35:05
    mi a gente estima pelo x Barra o nosso
  • 00:35:07
    desvio padrão da população o nosso Sigma
  • 00:35:10
    a gente estima pelo s pelo desvio padrão
  • 00:35:12
    da amostra e o nosso n a gente tem que é
  • 00:35:14
    o tamanho da nossa amostra isso aqui é
  • 00:35:15
    isso aqui é um é um número fácil né daí
  • 00:35:18
    a gente consegue fazer esse intervalo de
  • 00:35:20
    confiança eu quero fazer o intervalo de
  • 00:35:21
    confiança de 95% e daí eu coloco lá o
  • 00:35:24
    quê o x Barra eu tiro da Média da minha
  • 00:35:26
    amostra o s divido por ra do N é isso
  • 00:35:28
    aqui que a gente já tinha visto e o z a
  • 00:35:30
    gente tira daqui para conseguir ter os
  • 00:35:32
    95% Isso aqui vai ter em escala de de
  • 00:35:35
    erro padrão e daí a gente corrige esse
  • 00:35:37
    esse erro padrão pelo valor de Z Então a
  • 00:35:40
    gente vai quase dobrar aqui o
  • 00:35:42
    intervalinho de colocando 1.96 né quase
  • 00:35:45
    dobrar o intervalo do desvio padrão para
  • 00:35:47
    ter um intervalo de confiança 95% tem
  • 00:35:50
    que colocar vezes 1.96 ali tá colocando
  • 00:35:53
    esses três elementos a consegue calcular
  • 00:35:54
    o intervalo de confiança tá mas isso não
  • 00:35:56
    é o tema dessa aula de hoje não o tema
  • 00:35:58
    da aula de hoje era falar do teorema
  • 00:36:00
    central do limite
Tags
  • Lei das Médias
  • Teorema Central do Limite
  • Média Amostral
  • Desvio Padrão
  • Erros Padrão
  • Simulação Estatística
  • Distribuição Normal
  • Amostragem
  • R
  • Estatística Aplicada