Science Blog
HRサイエンス研究所®︎
2020.03.26
Contextual Bandit LinUCB LinTS
[latexpage] こんにちは。本日は文脈バンディットをやっていきます。行列とかでてきて、、、、計算が苦手な僕は、、、って感じなんですけどやってることは前回のUCBをTSと全く同じなので気楽にい……
2020.03.19
Doubly Robust AIPTW
こんにちは。本日はダブルロバストについて勉強します。まぁ、IPWも厳密には理解できていないんですけどね。。。。僕の勉強スタイルはとにかく大きく進んで大きく戻っての繰り返しです。するとたまにぱってアイ……
2020.02.07
バンディットアルゴリズムの続き
[latexpage] こんにちは。今回は前回のバンディットアルゴリズムの続きです。UCBと簡単なトンプソンサンプリングの実装を行います。前回実装した$\epsilon$-GreedyとBoltzm……
2020.01.29
強化学習 Bandit Algorithm で入門する
[latexpage] こんにちは。本日は強化学習に入門します。けどMDPとかはやらないので安心してください。簡単だと思います。ビジネスにおいてもバンディット問題は多くあるということなのでためになる……
2024.08.05
【お知らせ】ペルソナのデータをテーマにトークします
その他
2024.03.17
仕事での促進焦点と防止焦点
2023.05.26
技術書典14にHRサイエンスに関する書籍を出版してきました
2023.03.09
質問紙法によるデータ収集には仮説が大切である理由
2022.08.19
Implicit feedbackデータにおけるnegative sampling
推薦システム
HRサイエンス研究所の研究員、エンジニアによるサイエンスブログです。データの科学、人と組織の科学の2つを武器に挑戦を続けています。2つの科学に関する知見や技術情報などを発信しています。
TOP