ホーム » 機械学習 » Kernel-KmeansのNumpy実装

Kernel-KmeansのNumpy実装

こんにちは。

本日は実装です。カーネルk平均法を実装します。言語はいつも通りPythonです。

非線形データのクラスタリング手法のです。前回紹介したカーネルトリックを用いてデータを高次元空間へと写し、k-meansを行います。このトリックを用いて非線形データを分離するのですが初期値に非常に依存し、時にうまく分離することができません。なので実際に使われているところは見たことないですね、、

K-meansとほとんど同じです。

収束条件としてはcentroidの移動距離などが使われることもありますが今回はiterationで固定です。

上記の画像はステップ-2で述べた距離Dについてです。一般のK-meansでは微分してcentroidを求めますがそれと比較するとこっちは少し複雑ですね。

$m_c$ を代入すれば上記が得られます。あとはコードを書くだけです。

上述しましたがうまく分離するにはカーネル関数や初期値によります。でわ