不完全情報ゲームの代表例と言えるポーカーで初めてプロに勝った人工知能 Libratus*1の論文を理解するために, 最近, 大規模な展開形ゲームのナッシュ均衡を求めるための手法に関する論文を読んでいます. それの一環として, タイトルにもあるProbabilistic St…
今回はバンディットアルゴリズムや統計的学習理論で, 確率の評価で用いられる不等式について解説します. 最後に, 学習理論で最も重要な不等式の一つであるヘフディングの不等式まで証明します. 証明の中で, 確率論, 学習理論で用いられるテクニックがたくさ…
Quote saved.
Login to quote this blog
Failed to save quote. Please try again later.
You cannot quote because this article is private.