ホーム » 「バンディット」タグがついた投稿

タグアーカイブ: バンディット

Contextual Bandit LinUCB LinTS

こんにちは。 本日は文脈バンディットをやっていきます。行列とかでてきて、、、、計算が苦手な僕は、、、って感じなんですけどやってることは前回のUCBをTSと全く同じなので気楽にいきましょう。 Contextual Band […]

Continue Reading →

Doubly Robust AIPTW

こんにちは。 本日はダブルロバストについて勉強します。まぁ、IPWも厳密には理解できていないんですけどね。。。。僕の勉強スタイルはとにかく大きく進んで大きく戻っての繰り返しです。するとたまにぱってアイデアが生まれてわかる […]

Continue Reading →

バンディットアルゴリズムの続き

こんにちは。 今回は前回のバンディットアルゴリズムの続きです。UCBと簡単なトンプソンサンプリングの実装を行います。前回実装した-GreedyとBoltzmann Softmaxとの最終的な比較も行います。 Keywor […]

Continue Reading →

強化学習 Bandit Algorithm で入門する

こんにちは。 本日は強化学習に入門します。けどMDPとかはやらないので安心してください。簡単だと思います。ビジネスにおいてもバンディット問題は多くあるということなのでためになるかなーと思います。 Keywords この記 […]

Continue Reading →