Item type |
Symposium(1) |
公開日 |
2014-10-31 |
タイトル |
|
|
タイトル |
牌譜を用いた対戦相手のモデル化とモンテカルロ法によるコンピュータ麻雀プレイヤの構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Building computer mahjong players by modeling opponent players using game records and a Monte Carlo method |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
東京大学 |
著者所属 |
|
|
|
東京大学 |
著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
著者所属(英) |
|
|
|
en |
|
|
The University of Tokyo |
著者名 |
水上, 直紀
鶴岡, 慶雅
|
著者名(英) |
Mizukami, Naoki
Tsuruoka, Yoshimasa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
相手の手や見えない状態を予測することは不完全情報ゲームにおいて重要である.本論文では相手のモデルとモンテカルロ法を用いたコンピュータ麻雀プレイヤの構築法について述べる.相手のモデルは三つの要素(聴牌,待ち牌,得点)の組み合わせとし,各要素を個別に牌譜から予測モデルの学習を行う.モンテカルロ法のシミュレーション中の相手の挙動はこれらのモデルによって得られる確率分布に基づく.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者と同等である1681点が得られた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Predicting opponents' moves and hidden state is important in imperfect information games. This paper describes a method for building a mahjong program that models opponent players and performs Monte Carlo simulation with the models. We decompose an opponent’s play into three elements, namely, {\it tenpai}, {\it finishing tiles}, and {\it winning score}, and train predicting models for those lements using game records. Opponents' moves in Monte Carlo simulations are based on the probability distributions of the opponent models. We have evaluated the playing strength of the resulting program on a large online mahjong site ``Tenhou''. The program has achieved a rating of 1681, which is same as that of the intermediate human player. |
書誌情報 |
ゲームプログラミングワークショップ2014論文集
巻 2014,
p. 48-55,
発行日 2014-10-31
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |