PCAは固有ベクトルへの射影
そうです。たとえば400次元から2次元へのPCAは固有値を大きい方から2つ選び、対応する固有ベクトルに射影です。つまり軸を新しく定義している
つまり空間が変わっている
まさにこの図、3次元のデータ(左)にPCAをかけて2次元データ(右)にしている。軸が異なるどころかその数も変わっていることより空間が変わったことは明らか。 しかし、今回は次元を保ったまま空間を押しつぶす
をします。重要なのは次の考え方のみ!
適当に作った例だとが前回のPCAに対し
のように次元を保ったまま平面上の点に置き換える。上の図だとに対し
とできる。ただし、である。 まとめると、
あるベクトルたちの線型結合で全部書き直そう
ということ。上では3次元ベクトル2本用いて平面を構成した。を平面H上の点としようということ、これを全データ点で行う。計算してみよう。とするとでが貼る平面状の点を表すことができるのでを最小化するようなを見つければいい。このときとなる。ここで
これらの公式を用いて
(1)
微分を0とする。(2)
従って逆行列をかけることで(3)
つまり!(4)
がである。を
Vの列ベクトル空間がはる空間への射影行列
という。 では数学の時間です。データ(m次元)
平面を貼るベクトルを
ただし ,
とする。目標はを見つけ出すこと。見つかれば上で導出した射影行列を全データにかければ良い。なんだけど、ちょっと長くなるから次の記事で。 でわ。 READMORE