Item type |
Journal(1) |
公開日 |
2019-07-15 |
タイトル |
|
|
タイトル |
自動対戦棋譜の教師あり学習による翻数予測に基づく麻雀プレイヤ |
タイトル |
|
|
言語 |
en |
|
タイトル |
Computer Mahjong Players Based on Winning Score Prediction by Supervised Learning from Self-play |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 強化学習,不完全情報ゲーム |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
HEROZ株式会社 |
著者所属 |
|
|
|
東京大学大学院工学系研究科 |
著者所属(英) |
|
|
|
en |
|
|
HEROZ, Inc. |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Engineering, The University of Tokyo |
著者名 |
水上, 直紀
鶴岡, 慶雅
|
著者名(英) |
Naoki, Mizukami
Yoshimasa, Tsuruoka
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自己対戦を利用することで囲碁や将棋といった完全情報ゲームにおいて人間プレイヤを超えるコンピュータプレイヤが示されている.一方で不完全情報ゲームの分野である麻雀ではこのような研究は行われていない.そこで本論文では自動対戦棋譜の教師あり学習による麻雀プログラムを構築する方法について述べる.まず,人間の牌譜から教師あり学習によりコンピュータプレイヤを構築し,このプレイヤ同士を対局させることにより牌譜を生成する.次に,この牌譜を用いて手牌から和了の翻数を予測するモデルを機械学習により構築する.最終的に,この翻数予測モデルの出力と期待最終順位を用いて点数状況を考慮する麻雀プログラムを構築した.評価実験により,得られた翻数予測モデルは4翻以上の高い翻数の成功率を約1ポイント向上させることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recent reinforcement learning algorithms demonstrate that they can successfully achieve superhuman performance in the perfect information game such as Go or Shogi. However, in the domain of imperfect information game such as Mahjong, there is not much research using reinforcement learning. Therefore, this paper describes a method for building a mahjong program by supervised learning from self-play. First, a computer player is built from supervised learning from human's game records. The computer player's game records is generated by self-play. We train models that predict winning scores of a player's hand using game records. Our program decides moves based on the outputs of the prediction models and the expected final ranks. The program can predict future rewards and has obtained a skill for winning with high scores. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 60,
号 7,
p. 1325-1336,
発行日 2019-07-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |