在進行資料分析前,需先將變數或指標進行正規化或標準化,以取得單位的一致性。Sunrise在唸碩班時,常碰到許多同學甚至老師都不分清楚正規化與標準化,愈基礎的問題常會愈易忽略不重視,因此在此做個簡單說明:
正規化(Normalization): 假設有三組資料,將每組資料的數值調整成介於0~1之間,以取得單位的一致性與可比較性,常用於數量研究方法。
標準化(Standardization):假設有三組資料,將每組資料減去該組之平均數再除以該組之標準差的過程就叫標準化,每組資料此時資料的中心值會變成0、標準差會變成1,即成為標準常態分配,值會介於-X~X之間,以取得單位的一致性與可比較性,常用於統計分析。
沒有留言:
張貼留言