こんにちは。
料理にはまっているkzです。
本日はリッジ回帰行きましょう。次回実装します。🐷
Ridge Regression
過学習を防ごうということで導入された正則化回帰の一例。
–

正則化項を使用した回帰model
– パラメータに上限あり
たまにリッジ回帰はペナルティーありの線形回帰という記事を見かけますがそうではなく多項式回帰でもあります。つまりモデルが
(1) 
だけでなく
(2) 
もOKということ。
Notation
- Number of data:

- Dimension:

- Parameters:

つまり各データは
(3) 
と表されます。

も同様。
Constrained minimizationは
(4) 
(5) 
となりますが扱いずらいのでベクトル表示に変更し同時にKKT条件より最適化問題を同値なものに書き換えます。
(6) 
ではまず解を求めましょう。いつも通り微分をゼロとおいて解くだけ。今回のコスト関数は次の通り
(7) 
として

で微分する。
–
「ベクトルで微分・行列で微分」公式まとめ
(8) 
したがって
![Rendered by QuickLaTeX.com \[b_{ridge} = (X^TX + \lambda I)^{-1}X^Ty\]](https://research.miidas.jp/wp-content/ql-cache/quicklatex.com-3f73b5d19e6a7dd1b70bef45f87153d0_l3.png)

は正則をキープするためのものでしたね。
ここまでは前回の内容をちょっとだけ丁寧にやっただけのおさらいのようなものです。ここからが数学チック。
さて、この解が最適解かどうかを関数の凸性から確認してみましょう。凸性は前回やりましたがお椀型なら極小値が最小値になることでしたね。
–
第2章 凸関数
–
Convex functions
(9) 
に対して次は同値である。
–

が凸である
–

に対してヘッセ行列

がpositive-semi-define
では
(10) 
となりますね。ここでこれがpositive-semi-defineであることは次からわかります。

に対して
(11) 
とノルムの定義よりわかりました。

はほんまに凸か?
今見たのは
(12) 
の凸性ですよね。そして
(13) 
こちらは明らかに凸。では

が本当に凸かどうか。これは直感的には明らかですが証明が簡単なのでやってみましょう。
集合

を定義域とする関数

がともに凸関数であると仮定する。
このとき
![Rendered by QuickLaTeX.com \forall x,y \in X ~~ , ~~ \forall \lambda \in [0,1]](https://research.miidas.jp/wp-content/ql-cache/quicklatex.com-f88e69619a3148e59542c32cd07f0949_l3.png)
に対して

が凸であることを示す。
(14) 
(15) 
(16) 
Q.E.D.
Lassoは結構めんどくさいんですよね。。
でわ