Item type |
SIG Technical Reports(1) |
公開日 |
2023-03-11 |
タイトル |
|
|
タイトル |
生成型Low-resouce固有表現認識における固有表現ラベル分散表現の推定法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Estimating Named Entity Label Representation for Generative Low-Resource NER |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
学習・推定 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
奈良先端科学技術大学院大学先端科学技術研究科 |
著者所属 |
|
|
|
理化学研究所革新知能統合研究センター(AIP) |
著者所属 |
|
|
|
奈良先端科学技術大学院大学先端科学技術研究科 |
著者所属 |
|
|
|
理化学研究所革新知能統合研究センター(AIP) |
著者所属 |
|
|
|
奈良先端科学技術大学院大学先端科学技術研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Technology, Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Advanced Intelligence Project (AIP) |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Technology, Nara Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Advanced Intelligence Project (AIP) |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Technology, Nara Institute of Science and Technology |
著者名 |
澤田, 悠冶
寺西, 裕紀
大内, 啓樹
松本, 裕治
渡辺, 太郎
|
著者名(英) |
Yuya, Sawada
Hiroki, Teranishi
Hiroki, Ouchi
Yuji, Matsumoto
Taro, Watanabe
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
固有表現認識では,ユーザが設計する新規の固有表現クラスに対してより少量の事例で抽出することが求められる.Few-shot 固有表現認識は外部資源を用いた事前学習による手法が提案されているものの,これらの手法は系列ラベリングやスパンベースに基づいているため,入れ子・不連続なスパンに対応できない問題がある.本研究では,生成型言語モデルを少数事例で直接 Fine-tuning する固有表現認識モデルを考え,固有表現クラスの定義文を用いたクラス分散表現の活用法を提案する.既存固有表現認識データセットから少量のサンプルを作成して実験を行った結果,定義文を用いたクラス分散表現によって少数事例での抽出性能が向上し,複雑なスパンに対しても柔軟に抽出可能であることを確認した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Named entity recognition (NER) system needs to identify the entities of novel entity types with fewer examples. Few-shot NER systems can capture useful knowledge from external resources, but identifying the nested and discontinuous span is still challenging because their methods are based on sequence labeling and span-based method. We aim for a low-resource generative NER model corresponding to the complex span and propose utilizing methods that use label representation by the novel type’s descriptions. Experiments show that the proposed methods achieve competitive performances in few-shot scenarios, and can extract complex spans with limited samples. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10115061 |
書誌情報 |
研究報告自然言語処理(NL)
巻 2023-NL-255,
号 4,
p. 1-6,
発行日 2023-03-11
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8779 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |