Item type |
SIG Technical Reports(1) |
公開日 |
2016-01-14 |
タイトル |
|
|
タイトル |
Deep Learning画像認識エンジン生成作業効率化インターフェースの開発 |
タイトル |
|
|
言語 |
en |
|
タイトル |
An Efficient User Interface to Simplify Training Process of Deep Learning for Image Recognition |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属 |
|
|
|
NTTコムウェア(株) |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者所属(英) |
|
|
|
en |
|
|
NTT Comware Corporation. |
著者名 |
池松, 大志
中江, 俊博
長森, 藤江
井前, 麻理子
宮下, 直也
木全, 英明
|
著者名(英) |
Taishi, Ikematsu
Toshihiro, Nakae
Fujie, Nagamori
Mariko, Inomae
Naoya, Miyashita
Hideaki, Kimata
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
機械学習を用いた画像認識では,高精度の判定を可能にするために,大量の画像データと正解ラベルからなる学習データセットを用意する必要がある.学習データセット構築作業の効率化を目的としてラベル付与の自動化やクラウドソーシングが実施されているが,属人的・専門的な判断を要する場合については,むしろエンドユーザ自身によってラベル付与を実施することが望ましいと考える.そこで,本研究ではエンドユーザ自身が画像収集からエンジン生成までを効率的に実施することが可能な学習器のインターフェースの開発を行い,エンジン生成に要する作業時間の短縮を図った.具体的には,Deep Learning フレームワークとして広く利用されている Caffe を用いた Deep Learning 学習 API(Application Programming Interface) の開発および画像検索 API とのマッシュアップによる画像収集・登録・学習インターフェースを開発した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Image recognition by machine learning requires a large amount of image data with ground truth labels. Crowdsourcing is one method to gather image data from the Internet to create dataset of annotated images, however, it is not always suitable when target images are specialized for users. In this paper we propose an image recognition system with Deep Learning engine developed based on the assumption that most users are likely to put labels on just enough images to train according to their own criteria of prediction, especially for specialized tasks. The proposed system has an efficient user interface to provide uses with one-stop simplified operation from gathering images to generating a trained model, in order to moderate complicated operations and reduce total time for the operations. The proposed interface connects to our developed Deep Learning Training API (Application Programming Interface) that enables users to train image features based on a widely used Deep Learning framework “Caffe” and a publicly available image search API. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA11131797 |
書誌情報 |
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻 2016-CVIM-200,
号 14,
p. 1-6,
発行日 2016-01-14
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8701 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |