ludu-vorton

Machine learning, Causal Inference, Algorithmic game theoryなどに興味があります。

Entries from 2019-01-01 to 1 year

Probabilistic State Translation in Extensive Games with Large Actions Sets

不完全情報ゲームの代表例と言えるポーカーで初めてプロに勝った人工知能 Libratus*1の論文を理解するために, 最近, 大規模な展開形ゲームのナッシュ均衡を求めるための手法に関する論文を読んでいます. それの一環として, タイトルにもあるProbabilistic St…

ヘフディングの不等式(Hoeffding's inequality)と諸々の確率の評価の不等式

今回はバンディットアルゴリズムや統計的学習理論で, 確率の評価で用いられる不等式について解説します. 最後に, 学習理論で最も重要な不等式の一つであるヘフディングの不等式まで証明します. 証明の中で, 確率論, 学習理論で用いられるテクニックがたくさ…