Item type |
Symposium(1) |
公開日 |
2015-10-30 |
タイトル |
|
|
タイトル |
ディープラーニング麻雀 -オートエンコーダとドロップアウトの有効性- |
タイトル |
|
|
言語 |
en |
|
タイトル |
Deep Learning Mahjong - An Effectivity of Autoencoder and Dropout - |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
テンソル・コンサルティング株式会社 |
著者所属 |
|
|
|
テンソル・コンサルティング株式会社 |
著者所属(英) |
|
|
|
en |
|
|
Tensor Cunsulting Co.Ltd |
著者所属(英) |
|
|
|
en |
|
|
Tensor Cunsulting Co.Ltd |
著者名 |
築地, 毅
柴原, 一友
|
著者名(英) |
Tsuyoshi, Tsukiji
Kazutomo, Shibahara
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本稿ではディープラーニングの技術を用いて麻雀の評価関数を学習することを試みる.近年ディープラーニングの技術が確立し始めており,画像認識,音声認識,自然言語処理などの分野で優れた成果を上げている.ゲームの分野でも, ディープラーニングと強化学習を組み合わせたDeep Q Network により,多種多様なゲームの学習に成功しているが,筆者の知る限り,不完全情報ゲームへの適用は行われていない.そこで本稿では,不完全情報ゲームである麻雀の評価関数をディープラーニングの各種技術を利用して獲得し,有効性を評価する初の試みに取り組む.純粋な多層ニューラルネットとして学習した場合,ニューロンの数や層の深さを大きくしてネットワークの表現力を高めることで,学習データとの一致率は最大75.1%まで上がったが,テストデータとの一致率との大きな乖離が見られ,ディープラーニングの技術を用いることなく適切な学習をすることは難しいということが分かった.ディープラーニングの技術の一つであるオートエンコーダの採用有無により,収束状況や評価関数の精度に違いが見受けられたものの,汎化性能が高まるという結果は得られなかった.また,ディープラーニングの技術の一つであるドロップアウトにより,学習の過学習を抑え,テストデータとの一致率を37.2%から43.7%へ高めることに成功した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In this paper, we present learning the evaluation function in Mahjong using deep learning. Deep learning is getting result in the eld of the image recognition, the speech recognition, the natural-language processing and the game player agent by Deep Q Network . This is the rst challenge learning the evaluation function in Mahjong, imperfect information game, using deep learning. Simple multilayered neural network achieved 75.1% concordance rate in training data, but over-tting occured in the test data. Autoencoder that is one of deep learning method does not rise generalization ability in our experiments. Dropout that is also one of deep learning method achieves 43.7% concordance rate of the test data. |
書誌情報 |
ゲームプログラミングワークショップ2015論文集
巻 2015,
p. 136-142,
発行日 2015-10-30
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |