Qual é o teorema do limite central?

Qual é o teorema do limite central?
Anonim

Responda:

O teorema do limite central torna rigorosa a ideia intuitiva de que as estimativas da média (estimadas de algumas amostras) de alguma medida associada a alguma população melhoram à medida que o tamanho da amostra aumenta.

Explicação:

Imagine uma floresta contendo 100 árvores.

Agora imagine que (de forma irreal) que, medido em metros, um quarto deles tem uma altura de 2, um quarto deles tem uma altura de 3, um quarto deles tem uma altura de 4, e um quarto deles tem um altura de 5.

Imagine medir a altura de cada árvore na floresta e usar as informações para construir um histograma com tamanhos de escaninhos adequadamente escolhidos (por exemplo, 1,5 a 2,5, 2,5 a 3,5, 3,5 a 4,5 e 5,5 a 6,5; percebo que não especifiquei o bin para o qual os limites pertencem, mas isso não importa aqui).

Você poderia usar o histograma para estimar a distribuição de probabilidade das árvores. Claramente, não seria normal.De fato, desde que os pontos finais fossem escolhidos apropriadamente, seria um uniforme porque haveria um número igual de árvores correspondendo a uma das alturas especificadas em cada caixa.

Agora imagine entrar na floresta e medir a altura de apenas duas árvores; calcular a altura média dessas duas árvores e anotá-la. Repita essa operação várias vezes, para que você tenha uma coleção dos valores médios para amostras de tamanho 2. Se você fosse plotar um histograma das estimativas da média, ela não seria mais uniforme. Em vez disso, é provável que houvesse mais medições (estimativas da média baseada em amostras de tamanho 2) perto da altura média geral de todas as árvores na floresta (neste caso particular,

#(2 + 3 + 4 + 5)/4 = 3.5# metros).

Como haveria mais estimativas da média perto de média real da população (o que é conhecido neste exemplo irreal), do que longe da média, a forma deste novo histograma estaria mais próxima de uma distribuição normal (com um pico próximo da média).

Agora imagine-se indo para a floresta e repetindo o exercício, exceto que você mede a altura de três árvores, calculando a média em cada caso e anotando-a. O histograma que você construiria teria ainda mais estimativas da média perto da média real, com menos propagação (a chance de escolher três árvores em qualquer amostra, de modo que todas elas provenham de um dos grupos finais - ou o próprio alto ou muito curto - é menos do que escolher três árvores com uma seleção de alturas). A forma do seu histograma compreendendo uma estimativa do tamanho médio (cada média baseada em três medidas) seria mais próxima da distribuição normal e o correspondente desvio padrão (das estimativas da média, não da população parental) seria menor.

Repita isso para 4, 5, 6, etc, árvores por média, e o histograma que você construiria pareceria cada vez mais com uma distribuição normal (com tamanhos de amostra progressivamente maiores), com a média do distribuição de a estimativas da média estar mais perto da verdadeira média, e o desvio padrão das estimativas da média se tornando mais estreito e estreito.

Se você repetir o exercício para o caso (degenerado) em que todas as árvores são medidas (em várias ocasiões, fazendo uma anotação da média em cada caso), então o histograma terá estimativas da média apenas em uma das caixas (o que corresponde à média real), sem qualquer variação, de modo que o desvio padrão (a distribuição de probabilidade estimada a partir de) desse "histograma" seria zero.

Assim, o teorema do limite central observa que a média de algumas estimativas da média de algumas populações se aproximam assintoticamente da média real e do desvio padrão da estimativa da média (em vez do desvio padrão da distribuição da população parental). torna-se progressivamente menor para amostras maiores.