ホーム » 「バンディット」タグがついた投稿
タグアーカイブ: バンディット
Contextual Bandit LinUCB LinTS
こんにちは。 本日は文脈バンディットをやっていきます。行列とかでてきて、、、、計算が苦手な僕は、、、って感じなんですけどやってることは前回のUCBをTSと全く同じなので気楽にいきましょう。 Contextual Band […]
Doubly Robust AIPTW
こんにちは。 本日はダブルロバストについて勉強します。まぁ、IPWも厳密には理解できていないんですけどね。。。。僕の勉強スタイルはとにかく大きく進んで大きく戻っての繰り返しです。するとたまにぱってアイデアが生まれてわかる […]
バンディットアルゴリズムの続き
こんにちは。 今回は前回のバンディットアルゴリズムの続きです。UCBと簡単なトンプソンサンプリングの実装を行います。前回実装した-GreedyとBoltzmann Softmaxとの最終的な比較も行います。 Keywor […]
強化学習 Bandit Algorithm で入門する
こんにちは。 本日は強化学習に入門します。けどMDPとかはやらないので安心してください。簡単だと思います。ビジネスにおいてもバンディット問題は多くあるということなのでためになるかなーと思います。 Keywords この記 […]