Ridge Regression
過学習を防ごうということで導入された正則化回帰の一例。 – 正則化項を使用した回帰model – パラメータに上限あり たまにリッジ回帰はペナルティーありの線形回帰という記事を見かけますがそうではなく多項式回帰でもあります。つまりモデルが(1)
だけでなく(2)
もOKということ。Notation
- Number of data:
- Dimension:
- Parameters:
(3)
と表されます。も同様。 Constrained minimizationは(4)
(5)
となりますが扱いずらいのでベクトル表示に変更し同時にKKT条件より最適化問題を同値なものに書き換えます。(6)
ではまず解を求めましょう。いつも通り微分をゼロとおいて解くだけ。今回のコスト関数は次の通り(7)
としてで微分する。 – 「ベクトルで微分・行列で微分」公式まとめ(8)
したがっては正則をキープするためのものでしたね。 ここまでは前回の内容をちょっとだけ丁寧にやっただけのおさらいのようなものです。ここからが数学チック。 さて、この解が最適解かどうかを関数の凸性から確認してみましょう。凸性は前回やりましたがお椀型なら極小値が最小値になることでしたね。 – 第2章 凸関数 – Convex functions
(9)
に対して次は同値である。 – が凸である – に対してヘッセ行列がpositive-semi-defineでは
(10)
となりますね。ここでこれがpositive-semi-defineであることは次からわかります。に対して(11)
とノルムの定義よりわかりました。
はほんまに凸か?
今見たのは
(12)
の凸性ですよね。そして(13)
こちらは明らかに凸。ではが本当に凸かどうか。これは直感的には明らかですが証明が簡単なのでやってみましょう。集合を定義域とする関数がともに凸関数であると仮定する。 このときに対してが凸であることを示す。
(14)
(15)
(16)
Q.E.D.Lassoは結構めんどくさいんですよね。。 でわ