Akaike(赤池) information criterion (AIC)
赤池信息量準則是評估統計模型的複雜度和衡量統計模型「擬合」資料之優良性(Goodness of Fit)的一種標準,由日本統計學家赤池弘次創立和發展的。赤池信息量準則建立在信息熵的概念基礎上。
計算AIC必須已知目標資料分佈的封閉(解析)形式,以及獨立同分佈(i.i.d)的資料,但是分佈的參數未知。
- 經由獨立同分佈的資料,可以算出log-likelihood values。
- KL divergence: .
- 通常為資料的未知分佈(pdf),而為使用者猜測的分佈。
Kullback-Leibler divergence應用
- 為真實資料的機率分佈,通常只有收集的到資料樣本,但未知解析形式。
- 為自訂模型所代表的機率分佈,而為模型的參數。
- 目標是讓自訂模型的分佈可以擬合真實的分佈,因KL-divergece之值為0時,表示兩分佈相同。
- 而KL-divergence中為資料的分佈,無法調整,因此實際應用中,目標如下式。
- .
.
- 無交換性。
AIC概念
- 真實的資料分佈未知。
- 而模型的參數估計值是由已觀測到的資料所得出。
- 而觀測資料又是符合分佈的隨機資料之實現值。
- 由於觀測到的資料每次均不相同,因此模型所得到的參數估計值仍是隨機變數。
- 所以KL-divergence 也是隨機變數。
- 因此必須考慮KL-divergence的期望值才可得到定值,即考慮。
為了使模型分佈逼近真實分佈,須最小化下式:
- 其中 為可行(admissible)的模型分佈集合。
- 為模型根據資料所得出的MLE值。
- 為由資料分佈所得到的隨機樣本。
因此可得MELL .
Akaike的主要貢獻在於給出
- MLE是MELL的偏差估計式。
- 但是此偏差量會漸近(asymptotically)逼近,即模型的參數個數。
- 對於大樣本的不偏估計式為。
- 為分佈的likelihood function。