転移学習によるDeep Q-Networkの学習高速化に向けた検討

足立, 一樹; 佐々木, 勇人; 中田, 雅也; 濱津, 文哉; 濱上, 知樹

WEKO3

インデックスツリー

RootNode

アイテム

転移学習によるDeep Q-Networkの学習高速化に向けた検討

https://ipsj.ixsq.nii.ac.jp/records/180877

名前 / ファイル	ライセンス	アクション
IPSJ-Z79-5M-09.pdf (445.9 kB)	Copyright (c) 2017 by the Information Processing Society of Japan

Item type

National Convention(1)

公開日

2017-03-16

タイトル

転移学習によるDeep Q-Networkの学習高速化に向けた検討

言語

jpn

キーワード

主題Scheme

Other

主題

人工知能と認知科学

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_5794

資源タイプ

conference paper

著者所属

横浜国大

著者所属

横浜国大

著者所属

横浜国大

著者所属

横浜国大

著者所属

横浜国大

著者名

足立, 一樹
佐々木, 勇人
中田, 雅也
濱津, 文哉
濱上, 知樹

論文抄録

内容記述タイプ

Other

内容記述

Q-Learningに深層学習を取り入れた手法であるDeep Q-Network（DQN）には，従来のQ-Learningでは扱いきれない画像のような高次元の観測を直接扱うことができるという利点がある。しかし，課題として学習には膨大な回数のエピソードを繰り返す必要がある。この課題に対処するために，別のタスクで学習済みの畳み込みニューラルネットワーク（CNN）を利用した転移学習が行われている。転移学習によりエージェントはタスクに有用な特徴抽出を行える状態から学習を開始できると考えられる。本稿では転移を行うCNNの層数を変化させ，学習回数や得られる報酬にどのような影響が現れるかを実験により調査する。

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AN00349328

書誌情報

第79回全国大会講演論文集

巻 2017, 号 1, p. 217-218, 発行日 2017-03-16

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-20 04:40:17.119119

Show All versions

Cite as

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

転移学習によるDeep Q-Networkの学習高速化に向けた検討

× 足立, 一樹

× 佐々木, 勇人

× 中田, 雅也

× 濱津, 文哉

× 濱上, 知樹

Versions

Share

Cite as

エクスポート