• <option id="cacee"><noscript id="cacee"></noscript></option>
  • <table id="cacee"><noscript id="cacee"></noscript></table>
  • <td id="cacee"></td>
  • <option id="cacee"></option>
  • <table id="cacee"></table>
  • <option id="cacee"><option id="cacee"></option></option>
  • <table id="cacee"><source id="cacee"></source></table><td id="cacee"><rt id="cacee"></rt></td>
    <option id="cacee"><option id="cacee"></option></option>
     找回密碼
     立即注冊

    掃一掃,登錄網站

    首頁 百科 查看內容
    • 67703
    • 0
    • 分享到

    什么是正態分布?為何如此重要?終于有人講明白了

    2019-7-10 13:45

    來源: AI科技大本營 作者: Farhad Malik譯者:Monanfei

    為何如此多的變量都大致服從正態分布?


    這個現象可以由如下定理解釋:當在大量隨機變量上重復很多次實驗時,它們的分布總和將非常接近正態分布。

    由于人的身高是一個隨機變量,并且基于其他隨機變量,例如一個人消耗的營養量,他們所處的環境,他們的遺傳等等,這些變量的分布總和最終是非常接近正態的。

    這就是中心極限定理。

    本文的核心:

    我們從上文的分析得出,正態分布是許多隨機分布的總和。如果我們繪制正態分布密度函數,那么它的曲線將具有以下特征:

    如上圖所示,該鐘形曲線有均值為 100,標準差為1:

    均值是曲線的中心。這是曲線的最高點,因為大多數點都是均值。曲線兩側的點數相等。曲線的中心具有最多的點數。曲線下的總面積是變量所有取值的總概率。因此總曲線面積為 100%     


    更進一步,如上圖所示:

    約 68.2% 的點在 -1 到 1 個標準偏差范圍內。約 95.5% 的點在 -2 到 2 個標準偏差范圍內。約 99.7% 的點在 -3 至 3 個標準偏差范圍內。

    這使我們可以輕松估計變量的變化性,并給出相應置信水平,它的可能取值是多少。例如,在上面的灰色鐘形曲線中,變量值在 99-101 之間的可能性為 68.2%。

    版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。
    相關新聞
    發表評論

    請先 注冊/登錄 后參與評論

      回頂部
    • <option id="cacee"><noscript id="cacee"></noscript></option>
    • <table id="cacee"><noscript id="cacee"></noscript></table>
    • <td id="cacee"></td>
    • <option id="cacee"></option>
    • <table id="cacee"></table>
    • <option id="cacee"><option id="cacee"></option></option>
    • <table id="cacee"><source id="cacee"></source></table><td id="cacee"><rt id="cacee"></rt></td>
      <option id="cacee"><option id="cacee"></option></option>
      妖精视频