ホーム » 「強化学習」タグがついた投稿

タグアーカイブ: 強化学習

Contextual Bandit LinUCB LinTS

こんにちは。本日は文脈バンディットをやっていきます。行列とかでてきて、、、、計算が苦手な僕は、、、って感じなんですけどやってることは前回のUCBをTSと全く同じなので気楽にいきましょう。 Contextual Band […]

こんにちは。本日はダブルロバストについて勉強します。まぁ、IPWも厳密には理解できていないんですけどね。。。。僕の勉強スタイルはとにかく大きく進んで大きく戻っての繰り返しです。するとたまにぱってアイデアが生まれてわかる […]

こんにちは。今回は前回のバンディットアルゴリズムの続きです。UCBと簡単なトンプソンサンプリングの実装を行います。前回実装した-GreedyとBoltzmann Softmaxとの最終的な比較も行います。 Keywor […]

こんにちは。本日は強化学習に入門します。けどMDPとかはやらないので安心してください。簡単だと思います。ビジネスにおいてもバンディット問題は多くあるということなのでためになるかなーと思います。 Keywords この記 […]