我們可以將變量的分布轉換為正態分布。
我們有多種方法將非正態分布轉化為正態分布:
1. 線性變換
一旦我們收集到變量的樣本數據,我們就可以對樣本進行線性變化,并計算Z得分:
計算平均值計算標準偏差對于每個 x,使用以下方法計算 Z:
2. 使用 Boxcox 變換
我們可以使用 SciPy 包將數據轉換為正態分布:
scipy.stats.boxcox(x, lmbda=None, alpha=None)
3. 使用 Yeo-Johnson 變換
另外,我們可以使用 yeo-johnson 變換。Python 的 sci-kit learn 庫提供了相應的功能:
sklearn.preprocessing.PowerTransformer(method=’yeojohnson’,standardize=True, copy=True)
版權申明:本內容來自于互聯網,屬第三方匯集推薦平臺。本文的版權歸原作者所有,文章言論不代表鏈門戶的觀點,鏈門戶不承擔任何法律責任。如有侵權請聯系QQ:3341927519進行反饋。