Item type |
Symposium(1) |
公開日 |
2015-10-30 |
タイトル |
|
|
タイトル |
期待最終順位に基づくコンピュータ麻雀プレイヤの構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Building Computer Mahjong Players Based on Expected Final Ranks |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
東京大学工学系研究科 |
著者所属 |
|
|
|
東京大学工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering |
著者名 |
水上, 直紀
鶴岡, 慶雅
|
著者名(英) |
Naoki, Mizukami
Yoshimasa, Tsuruoka
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
長期的な戦略に基づく手の決定は繰り返しゲームにおいて重要である.本論文では麻雀の繰り返しゲームの性質に着目して最終順位を考慮したコンピュータ麻雀プレイヤの構築法について述べる.牌譜中に現れた点数状況から最終順位を予測するモデルの学習を行う.モンテカルロ法のシミュレーションでの報酬を予測モデルの結果を用いることで最終順位に基づく手をプログラムは選択する.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者を超える1844点が得られた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Deciding moves based on a long-term strategy is important in repeated games. This paper describes a method for building a mahjong program that considers expected final ranks by taking the repeated-game property of mahjong into account. We train prediction models using information about game states and final ranks in game records. Our program decides moves based on the final ranks obtained from Monte Carlo simulation using the prediction models. We have evaluated the playing strength of the resulting program on a large online mahjong site "Tenhou". The program has achieved a rating of 1844, which is considerably higher than that of the intermediate human player. |
書誌情報 |
ゲームプログラミングワークショップ2015論文集
巻 2015,
p. 179-186,
発行日 2015-10-30
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |