WEKO3
-
RootNode
アイテム
転移学習によるDeep Q-Networkの学習高速化に向けた検討
https://ipsj.ixsq.nii.ac.jp/records/180877
https://ipsj.ixsq.nii.ac.jp/records/1808778b297fac-d14a-4306-ae38-fda3eb7272a2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2017 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2017-03-16 | |||||||||||||||
タイトル | ||||||||||||||||
タイトル | 転移学習によるDeep Q-Networkの学習高速化に向けた検討 | |||||||||||||||
言語 | ||||||||||||||||
言語 | jpn | |||||||||||||||
キーワード | ||||||||||||||||
主題Scheme | Other | |||||||||||||||
主題 | 人工知能と認知科学 | |||||||||||||||
資源タイプ | ||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||
資源タイプ | conference paper | |||||||||||||||
著者所属 | ||||||||||||||||
横浜国大 | ||||||||||||||||
著者所属 | ||||||||||||||||
横浜国大 | ||||||||||||||||
著者所属 | ||||||||||||||||
横浜国大 | ||||||||||||||||
著者所属 | ||||||||||||||||
横浜国大 | ||||||||||||||||
著者所属 | ||||||||||||||||
横浜国大 | ||||||||||||||||
著者名 |
足立, 一樹
× 足立, 一樹
× 佐々木, 勇人
× 中田, 雅也
× 濱津, 文哉
× 濱上, 知樹
|
|||||||||||||||
論文抄録 | ||||||||||||||||
内容記述タイプ | Other | |||||||||||||||
内容記述 | Q-Learningに深層学習を取り入れた手法であるDeep Q-Network(DQN)には,従来のQ-Learningでは扱いきれない画像のような高次元の観測を直接扱うことができるという利点がある。しかし,課題として学習には膨大な回数のエピソードを繰り返す必要がある。この課題に対処するために,別のタスクで学習済みの畳み込みニューラルネットワーク(CNN)を利用した転移学習が行われている。転移学習によりエージェントはタスクに有用な特徴抽出を行える状態から学習を開始できると考えられる。本稿では転移を行うCNNの層数を変化させ,学習回数や得られる報酬にどのような影響が現れるかを実験により調査する。 | |||||||||||||||
書誌レコードID | ||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||
収録物識別子 | AN00349328 | |||||||||||||||
書誌情報 |
第79回全国大会講演論文集 巻 2017, 号 1, p. 217-218, 発行日 2017-03-16 |
|||||||||||||||
出版者 | ||||||||||||||||
言語 | ja | |||||||||||||||
出版者 | 情報処理学会 |