スパース推定とは
スパースは”疎”を意味します。スパース推定とはどのパラメータが0になるかを推定すること。つまり、データの本質がわかります。直感的には次の図から もう少し実用的な例は? 右の入力から左の出力を考えるLassoモデルを考えると のようにアレルゲン反応のスパース推定ができます。 つまり、スパース推定により関与しないパラメータがわかります。Group Lassoとは
グループラッソとは
「潰れる変数がグループになったLassoモデル」
先ほどのアレルゲンを例にとると例えば、ヒノキなどの個体単位ではなく「花粉」というグループ単位でスパース性が検証できるモデルのことです。Lassoはの正規化項は次のものでした。
Group Lassoの正規化項は次で定義されます
ここではg番目のグループを表すindex。(ただし、、はグループgの大きさ) 前述通りGroup Lassoでは特徴をグループ化します。よって、事前に類似の傾向がありそうな特徴の情報を考慮します。 なるほど、と思った方と、ん?、と思った方がいると思います。
グループ単位で本当に潰れるのか?
仮にそうならどうやって変数を扱うのか?
これは図を用いてチェックしましょう。
Group Lassoの解
- 参考文献の論文に従い、解説します。
まず個の変数からなるもっとも一般的な回帰問題を考えます
Yはベクトル、、は番目のデータに対応した行列ではサイズの係数からなるベクトルとする。さらに各は直交行列であると仮定する。 すなはちとする。さらに、、とすると上式はかける。
長ったらしく書きましたが要は「グループの大きさが各のサイズ」です。なのでを考えるとこれはLassoそのものとなります。
との正定値対称行列に対して次を定める。
ただし、とする。正定値行列が与えられた時、Group Lasso回帰では次の解を考える。ただし
Bakin(1999)はこれをグループ変数によるLassoの拡張版として提案しました。
ここも特に気にする必要はなく、大切なのは正定値対称行列により変数に「重み」が掛かっているところです。機械学習ではこのように変数に重みを加える動作をよくします。一例として – マハラノビス距離(Mahalanobis distance) があります。僕たちが無意識に距離として使っているものはユークリッドノルムで、つまり単位行列の時です。 では先ほどの
「どうやってグループ単位で変数が潰れるのか?」
をみましょう。
下の図はグループが2つ(各係数はベクトルとスカラー)、つまりの場合を考え、が単位行列の場合の正規化項を表しています(ラッソはダイヤ、リッジは円だったやつの三次元バージョン)
つまり、
- Figure(a)は
- Figure(e)は
- Figure(i)は
- Figure(a)は Lassoの-norm
- Figure(e)は GroupLassoのnorm
- Figure(i)は Ridgeの-norm