歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計(jì)分布性。歸一化在0-1之間是統(tǒng)計(jì)的概率分布,歸一化在某個區(qū)間上是統(tǒng)計(jì)的坐標(biāo)分布。歸一化有同一、統(tǒng)一和合一的意思。
1、(0,1)標(biāo)準(zhǔn)化:
這是最簡單也是最容易想到的方法,通過遍歷feature vector里的每一個數(shù)據(jù),將Max和Min的記錄下來,并通過Max-Min作為基數(shù)(即Min=0,Max=1)進(jìn)行數(shù)據(jù)的歸一化處理:
LaTex:{x}_{normalization}=frac{x-Min}{Max-Min}
Python實(shí)現(xiàn):
2、Z-score標(biāo)準(zhǔn)化:
這種方法給予原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,這里的關(guān)鍵在于復(fù)合標(biāo)準(zhǔn)正態(tài)分布,個人認(rèn)為在一定程度上改變了特征的分布,關(guān)于使用經(jīng)驗(yàn)上歡迎討論,我對這種標(biāo)準(zhǔn)化不是非常地熟悉。