這個現象可以由如下定理解釋:當在大量隨機變量上重復很多次實驗時,它們的分布總和將非常接近正態分布。
由于人的身高是一個隨機變量,并且基于其他隨機變量,例如一個人消耗的營養量,他們所處的環境,他們的遺傳等等,這些變量的分布總和最終是非常接近正態的。
這就是中心極限定理。
本文的核心:
我們從上文的分析得出,正態分布是許多隨機分布的總和。如果我們繪制正態分布密度函數,那么它的曲線將具有以下特征:
如上圖所示,該鐘形曲線有均值為 100,標準差為1:
均值是曲線的中心。這是曲線的最高點,因為大多數點都是均值。曲線兩側的點數相等。曲線的中心具有最多的點數。曲線下的總面積是變量所有取值的總概率。因此總曲線面積為 100%
約 68.2% 的點在 -1 到 1 個標準偏差范圍內。約 95.5% 的點在 -2 到 2 個標準偏差范圍內。約 99.7% 的點在 -3 至 3 個標準偏差范圍內。
這使我們可以輕松估計變量的變化性,并給出相應置信水平,它的可能取值是多少。例如,在上面的灰色鐘形曲線中,變量值在 99-101 之間的可能性為 68.2%。
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。