WEKO3
-
RootNode
アイテム
カーネルテンソル分解を用いた教師なし学習による変数選択法~バイオインフォマティクスへの応用~
https://ipsj.ixsq.nii.ac.jp/records/209958
https://ipsj.ixsq.nii.ac.jp/records/20995856fc4fa3-342b-40f5-980c-dcfe66e9ae97
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2021-03-04 | |||||||
タイトル | ||||||||
タイトル | カーネルテンソル分解を用いた教師なし学習による変数選択法~バイオインフォマティクスへの応用~ | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Kernel tensor decomposition based unsupervised feature extraction-Applications to bioinformatics- | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般発表 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
中央大学理工学部物理学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Physics, Chuo Univeristy | ||||||||
著者名 |
田口, 善弘
× 田口, 善弘
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 変数の数に比べてサンプル数が少ないいわゆる large p small n 問題については,多くの研究が為されている.だがいわゆるゲノム科学の分野ではこの比が極端であり,遺伝子の数(=変数の数=p)が数万個であるのに対して被験者の数(=サンプル数= n)が数個の場合さえあり p/n~103 であることも稀ではない.このような極端な場合にはいわゆる large p small n 問題に対して提案された多くの方法が無力である場合が多い.我々はこの問題に対処するため「主成分分析あるいはテンソル分解を用いた教師無し学習による変数選択法」を提案し,この 10 年程の間に多くのバイオインフォマティクスの分野の研究に応用してきた.しかし,この方法は純粋に線形代数の範囲内の方法であり,教師無し学習であるためにチューニングパラメーターもなく,手法がうまく行かない場合には解析そのものを諦める以外になかった.今回,我々はこの問題を解決するために同手法のカーネル化に成功した.これにより同法は非線形関係を考慮できるようになり大きくその適応範囲が拡大したということができるのでその内容について報告する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A lot of research has been done on the so-called large p small n problem, where the number of samples is small compared to the number of variables. In the so-called field of genome science, however, this ratio is extreme, with the number of genes (= number of variables = p) being tens of thousands while the number of subjects (= number of samples = n) is even a few, and p/n ~ 103 is not uncommon. In such extreme cases, many of the methods proposed for the so-called large p small nproblem are often ineffective. We have proposed “Principal component analysis and tensor decomposition based unsupervised feature extraction” to deal with this problem. In the past decade, we have applied this method to many researches in the field of bioinformatics. However, this method is purely within the scope of linear algebra, and since it is unsupervised learning, there is no tuning parameter, and if the method does not work, there is no choice but to give up on the analysis itself. In order to solve this problem, we have developed a kernel version of the method. In this paper, we report on how we succeeded in kernelizing the method to solve this problem, which enables the method to take nonlinear relationships into account and greatly expands its application range. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA12055912 | |||||||
書誌情報 |
研究報告バイオ情報学(BIO) 巻 2021-BIO-65, 号 2, p. 1-9, 発行日 2021-03-04 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8590 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |