Čo je to centrálna hraničná veta?

Čo je to centrálna hraničná veta?
Anonim

odpoveď:

Centrálna hraničná teoréma robí prísnu intuitívnu myšlienku, že odhady priemerných (odhadovaných z nejakej vzorky) niektorých meraní spojených s niektorou populáciou sa zlepšujú s rastúcou veľkosťou vzorky.

vysvetlenie:

Predstavte si les obsahujúci 100 stromov.

Teraz si predstavte, že (skôr nereálne), že jedna štvrtina z nich meria v metroch, má výšku 2, jedna štvrtina má výšku 3, jedna štvrtina z nich má výšku 4 a jedna štvrtina z nich má výška 5.

Predstavte si meranie výšky každého stromu v lese a pomocou informácií vytvorte histogram s vhodne zvolenými veľkosťami zásobníkov (napr. 1,5 až 2,5, 2,5 až 3,5, 3,5 až 4,5 a 5,5 až 6,5; bin, do ktorého hranice patria, ale na tom nezáleží).

Histogram môžete použiť na odhad rozdelenia pravdepodobnosti stromov. Samozrejme, nebolo by to normálne.V skutočnosti, za predpokladu, že koncové body boli zvolené vhodne, bolo by to jednotné, pretože by bol rovnaký počet stromov zodpovedajúcich jednej zo špecifikovaných výšok v každej nádobe.

Teraz si predstavte, že pôjdete do lesa a zmeráte výšku len dvoch stromov; vypočítajte priemernú výšku týchto dvoch stromov a poznačte si to. Túto operáciu zopakujte niekoľkokrát, takže by ste mali zbierať priemerné hodnoty pre vzorky veľkosti 2. Ak by ste mali vykresliť histogram odhadov priemeru, už by nebol jednotný. Namiesto toho je pravdepodobné, že by existovalo viac meraní (odhady priemeru na základe vzoriek veľkosti 2) v blízkosti celkovej priemernej výšky všetkých stromov v lese (v tomto konkrétnom prípade

#(2 + 3 + 4 + 5)/4 = 3.5# metre).

Ako by bolo viac odhadov priemeru blízko skutočná populácia (čo je známe v tomto nereálnom príklade), ďaleko od priemeru, by bol tvar tohto nového histogramu bližšie k normálnemu rozloženiu (s píkom v blízkosti priemeru).

Teraz si predstavte, že pôjdete do lesa a opakujete cvičenie okrem toho, že si zmeráte výšku 3 stromov, vypočítate priemer v každom prípade a zapíšete si to. Histogram, ktorý by ste vytvorili, by mal ešte viac odhadov priemeru v blízkosti skutočného priemeru, s menším rozložením (šanca vybrať tri stromy v každej vzorke tak, aby všetci pochádzali z jednej z koncových skupín - buď veľmi vysoká alebo veľmi krátka --- je menšia ako vychystávanie troch stromov s výberom výšok). Tvar histogramu zahŕňajúci odhad priemernej veľkosti (každá priemerná hodnota založená na troch meraniach) by bol bližšie k tvaru normálneho rozdelenia a zodpovedajúca štandardná odchýlka (odhadov priemeru, nie materskej populácie) by bola menšie.

Tento postup zopakujte pre 4, 5, 6, atď., Stromy na priemer a histogram, ktorý by ste vytvorili, bude vyzerať viac a viac ako normálne rozdelenie (s postupne väčšími veľkosťami vzoriek), s priemerom distribúcia odhadov priemeru bližšie k pravému priemeru a štandardná odchýlka odhadov znamená, že sa zužuje a zužuje.

Ak zopakujete cvičenie pre (degenerovaný) prípad, v ktorom sa merajú všetky stromy (pri viacerých príležitostiach, zaznamenávajúc priemer v každom prípade), potom bude mať histogram odhady priemeru iba v jednom zo zásobníkov. (ten, ktorý zodpovedá skutočnému priemeru), bez akejkoľvek variácie tak, že štandardná odchýlka (rozdelenie pravdepodobnosti odhadnutá z), že "histogram" by bol nula.

Centrálna hraničná veta teda uvádza, že priemer niektorých odhadov priemeru niektorých populácií sa asymptoticky približuje skutočnému priemeru a štandardná odchýlka odhadu priemeru (skôr než štandardná odchýlka distribúcie materskej populácie) pre väčšie veľkosti vzoriek sa postupne zmenšuje.