Item type |
Symposium(1) |
公開日 |
2022-08-29 |
タイトル |
|
|
タイトル |
データセットの多種多様な属性情報抽出に向けた多面的クラスタリング変分オートエンコーダの手書き文字データへの適用 |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
ポスター論文 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
株式会社日立製作所研究開発グループデジタルサービス研究統括本部サービスシステムイノベーションセンタ |
著者所属 |
|
|
|
株式会社日立製作所研究開発グループデジタルサービス研究統括本部サービスシステムイノベーションセンタ |
著者所属 |
|
|
|
株式会社日立製作所研究開発グループデジタルサービス研究統括本部サービスシステムイノベーションセンタ |
著者所属 |
|
|
|
株式会社日立製作所デジタルシステム&サービス統括本部 |
著者所属(英) |
|
|
|
en |
|
|
Service Systems Innovation Center, Center for Digital Services, Research & Development Group, Hitachi, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Service Systems Innovation Center, Center for Digital Services, Research & Development Group, Hitachi, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Service Systems Innovation Center, Center for Digital Services, Research & Development Group, Hitachi, Ltd. |
著者所属(英) |
|
|
|
en |
|
|
Digital Systems and Services Division, Hitachi, Ltd. |
著者名 |
関根, 理敏
新原, 敦介
明神, 智之
今谷, 恵理
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
一般にAIのモデルの品質は利用するデータに依存するため,データの品質評価手法の確立することが重要である.データ品質を定量的に評価するため,誤判別等のリスクの要因となるデータの様々な属性情報を抽出し,評価することが必要である.そこで本稿では,あるデータに対して複数の観点で特徴抽出が可能な手法である多面的クラスタリング変分オートエンコーダ(Multi-Facet Clustering Variational Autoencoders(MFCVAE))を利用して,帳票の手書き文字データセットの品質評価を行った.その結果,MFCVAEのモデルから得られた特徴量を利用することで,文字の種別だけでなく,文字の太さやノイズの有無等に依存した特徴量を分析することが可能で,多種多様な属性情報の抽出や,属性情報に対応する類似データの取得に有力な手法であることが分かった.今後の課題として,ユーザがより解釈しやすい特徴量の抽出方法の確立や,現場での適用・評価に向けたツール化等が挙げられる. |
書誌情報 |
ソフトウェアエンジニアリングシンポジウム2022論文集
巻 2022,
p. 145-146,
発行日 2022-08-29
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |