離差即標(biāo)志變動(dòng)度,又稱“偏差”,是觀測(cè)值或估計(jì)量的平均值與真實(shí)值之間的差,是反映數(shù)據(jù)分布離散程度的量度之一,或說(shuō)是反映統(tǒng)計(jì)總體中各單位標(biāo)志值差別大小的程度或離差情況的指標(biāo),常寫(xiě)作:
即參與計(jì)算平均數(shù)的變量值與平均數(shù)之差。離差的性質(zhì)有二:(1)離差的代數(shù)和等于0;(2)參與計(jì)算平均數(shù)的各變量值與平均數(shù)之差的平均和,小于這些變量值與平均數(shù)之外的任何數(shù)之差的平均和。
根據(jù)不同的度量可以定義不同的離差(或者變差)
最常用的有:全距、平均偏差、半內(nèi)四分位數(shù)間距、10-90百分位數(shù)間距和標(biāo)準(zhǔn)差。
1)全距:一組數(shù)中的最大數(shù)與最小數(shù)和差。
2)平均偏差:N個(gè)數(shù)x1,x2,……,xn的平均偏差,簡(jiǎn)記為MD。
3)半內(nèi)四分位數(shù)間距:Q*=(Q3-Q1)/2。
4)10~90百分位數(shù)間距來(lái)作為離差的度量p=p90-p10。
5)標(biāo)準(zhǔn)差:S=sqrt(xi-mean(x))2/n)。
在做聚類分析時(shí),可以根據(jù)離差值的大小,將數(shù)據(jù)聚為一類。