WEKO3
-
RootNode
アイテム
麻雀の牌譜からの打ち手評価関数の学習
https://ipsj.ixsq.nii.ac.jp/records/97660
https://ipsj.ixsq.nii.ac.jp/records/97660f3683852-b192-41c9-a41b-7f9c662118d9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Symposium(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-11-09 | |||||||
タイトル | ||||||||
タイトル | 麻雀の牌譜からの打ち手評価関数の学習 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Learning of evaluation functions in accord with game records in mahjong | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属 | ||||||||
東京大学大学院新領域創成科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Frontier Sciences, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Frontier Sciences, The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Frontier Sciences, The University of Tokyo | ||||||||
著者名 |
北川, 竜平
三輪, 誠
近山, 隆
× 北川, 竜平 三輪, 誠 近山, 隆
|
|||||||
著者名(英) |
Kitagawa, Ryouhei
Miwa, Makoto
Chikayama, Takashi
× Kitagawa, Ryouhei Miwa, Makoto Chikayama, Takashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本研究では不完全情報ゲームである麻雀においてコンピュータプレイヤの教師あり学習による評価関数のパラメータの調整を行った.評価関数としては 3 層ニューラルネットワークを用いた.麻雀のゲームの記録である牌譜を用いた学習のために,コンピュータ麻雀プレイヤが最善手と判断した手と牌譜の中で実際に打たれた手との一致度を測る目的関数を最適制御理論に基づき定義した.目的関数によって求められる値を小さくすることを目的としバックプロパゲーションによって評価関数の調整を行った.結果として,コンピュータ麻雀プレイヤが最善手と判断した手と牌譜内で打たれた手との一致率はツモ局面において約 56%,鳴き局面において約 89%であった.インターネット麻雀サーバである東風荘でのレーティングは 1318 となった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this study, evaluation functions of a computer mahjong player were tuned by supervised learning. The three layer neural networks were used as evaluation functions. For learning by game records, object function based on an optimal control theory was dened for measuring concordance of the best move for computer game player and the selected move in game records. The evaluation functions were tuned by backpropagation for minimization of the value calculated the object function. As a result, a agreement rate of the best move for computer game player and the selected move in game records was about 56% in positions of tsumo, about 89% in positions of naki. The rating of Tonpusou that was internet mahjong server was 1318. | |||||||
書誌情報 |
ゲームプログラミングワークショップ2007論文集 巻 2007, 号 12, p. 76-83, 発行日 2007-11-09 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |