SVM実装の際に困った双対とは

2019.08.19

機械学習

こんにちは。

SVMのNumpy実装が非常に難しいです。SMOというアルゴリズムが主流で他には単一法などがあるようですが難しすぎます。そこで僕は下界または上界を最適化、勾配法でやろうと思っているのですがうまくいかずずっと止まっている状態です。

SVMの実装自体非常に少ないと思うのですが理論面について述べている記事はさらにありません。ここでは理論面の「双対」に焦点を置いて解説したいと思います。解説にあたってこのレジュメを使用します。

双対の例題

必要な栄養を摂りながら食費を最小にするにはどのような割合で二つの食品を購入すれば良いか?

(1) $\begin{align*} (\mathcal{P}) \textrm{ Minimize } x + 4y\ \textrm{Subject to } 2x + y \geq 6 , 5x + 3y \geq 7 , x,y \geq 0 \end{align*}$

一方で、必要な栄養を摂りながら食費を最小にするにはどのような割合で二つの食品を購入すれば良いか？

この時、問題 $(\mathcal{P})$ より商品1 $(x)$ 、2 $(y)$ に含まれる栄養の価格をそれぞれ見積もると

「栄養1が2単位」　+ 「栄養2が5単位」　= 「価格 1」
「栄養1が1単位」　+ 「栄養2が3単位」　= 「価格 4」

となる。ここで栄養素1を含むものをビタミン剤1としその単位あたりの値段をaとする、同様にもう一方をbとすると

(2) $\begin{align*} 2a + 5b \leq 1 , a + 3b \leq 4 \end{align*}$

となるようにビタミン剤の価格を設定すればよいです。また、最低摂取量よりビタミン剤1は6単位、ビタミン剤2は7単位、それぞれ購入されます。したがって、食品との競合に負けずに利益を最大にするように価格を設定するためには次の問題を解けば良いです。

(3) $\begin{align*} (\mathcal{D}) \textrm{ Maximize } 6a + 7b \ \textrm{Subject to } 2a + 5b \leq 1 , a + 3b \leq 4 , a,b \geq 0 \end{align*}$

ここからが大切です。ここで各制約が満たされていると仮定し、それぞれの目的関数を比較して見ると

$x+4y \geq (2a + 5b)x + (a + 3b)y$

$= (2x + y)a + (5x + 3y)b$

$\geq 6a + 7b$

となり「 $(\mathcal{P})$ の食品購入費」 $\geq$ 「 $(\mathcal{D})$ のビタミン剤購入費」が成り立っていることがわかります。これをコツコツとくと最適解は $\mathcal{P}$ の最小費用 = 3 $\geq$ 3 = $\mathcal{D}$ の最大利益

$(a,b) = (\frac{1}{2}, 0) , (x,y) = (3,0)$

なんと互いに異なる最適化問題の解が一致。ここで初めの問 $(\mathcal{P})$ を主問題、続く問題 $(\mathcal{D})$ をその双対問題といいます。
ちゃんと進めましたがこれでは僕は全く理解できなかったのでもう少し調べてみました。すると次のことがわかりました。

ラグランジュ緩和

とある問題を解くのが困難な場合、これをもう少し簡単な問題に緩和しようというアプローチしたいですよね。例えば、問題の制約式をどれか取り除いてしまった問題は、制約が「緩和されている」ことから緩和問題と呼ばれます。しかしながら、制約を取り去ってしまうことは、緩和の度合が激し過ぎて、緩和問題の最適解が元の問題からかけ離れてしまうことがしばしばあります。では制約を取り去ってしまうより、もう少しましな緩和法はないだろうか？そこで良く使われるのがラグランジュ緩和です。

軸として考える問題を「主問題」と呼びます。双対問題とはその補集合を解くイメージです。今回の例だとMinimize問題をMaximize問題へと変形します。

(4) $\begin{align*} (\mathcal{P}) \textrm{ Minimize } x + 4y\ \textrm{Subject to } 2x + y \geq 6 , 5x + 3y \geq 7 , x,y \geq 0 \end{align*}$