WEKO3
-
RootNode
アイテム
教師データが不足した環境での機械学習結果改善手法
https://ipsj.ixsq.nii.ac.jp/records/175956
https://ipsj.ixsq.nii.ac.jp/records/17595647851438-d767-41fa-a605-2d4505a4de08
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2016-11-15 | |||||||
タイトル | ||||||||
タイトル | 教師データが不足した環境での機械学習結果改善手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Refinement of Machine Learning Results Generated from Insufficient Sample Data | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [特集:ゲームプログラミング] 教師あり機械学習,ヒューリスティクス,将棋 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
株式会社富士通研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者名 |
金澤, 裕治
× 金澤, 裕治
|
|||||||
著者名(英) |
Yuzi, Kanazawa
× Yuzi, Kanazawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 厳密解を求めるのが困難でヒューリスティクスによって解かれている問題で,計算機が熟練者を上回ることが困難なものが存在する.そのような問題において,ヒューリスティクス手法を多数のパラメータで制御できるようにしておき,そのパラメータを機械学習によりチューニングすることで,熟練者の判断を再現できれば,解法の性能向上が期待できる.そのために解決しなければならない課題の1つが,教師データの不足である.本論文では,教師データが不足した環境で学習結果に含まれる誤りを改善する強化学習類似手法を提案する.提案手法を将棋プログラムBonanza 6.0の機械学習テーブル改善に適用し,1回の適用でイロレーティングが平均25程度,繰り返し適用することで,最終的には150程度向上した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | There are some problems where human experts can produce better result than heuristics methods on computers. Performance of such heuristics methods may be improved significantly by machine learning on result by human experts. An issue that must be solved to make it possible is sample data shortage. This paper proposes a reinforcement-learning-like method to fix errors in machine learning result generated from insufficient sample data. The method was applied to refine parameters used by the shogi program Bonanza 6.0. Experimental results show that Elo rating of Bonanza 6.0 with refined parameters was improved by 150 points. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 57, 号 11, p. 2382-2391, 発行日 2016-11-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |