WEKO3
-
RootNode
アイテム
アラビア語の高粒度な品詞タグ付けのための辞書情報を活用した形態統語的カテゴリの同時予測
https://ipsj.ixsq.nii.ac.jp/records/182715
https://ipsj.ixsq.nii.ac.jp/records/182715fe129f63-7703-4152-8590-5f4199f28f30
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2017 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2017-07-12 | |||||||||||
タイトル | ||||||||||||
タイトル | アラビア語の高粒度な品詞タグ付けのための辞書情報を活用した形態統語的カテゴリの同時予測 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 多言語処理と言語学習支援 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学 | ||||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学 | ||||||||||||
著者所属 | ||||||||||||
奈良先端科学技術大学院大学 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Nara Institute of Science and Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Nara Institute of Science and Technology | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Nara Institute of Science and Technology | ||||||||||||
著者名 |
井上, 剛
× 井上, 剛
× 進藤, 裕之
× 松本, 裕治
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | アラビア語などの形態的に豊かな言語の品詞タグ付けは,英語など形態的に乏しい言語の品詞タグ付けに比べ,タグセットが膨大になるため,困難な問題である.これは,言語固有の情報を反映した高粒度な品詞タグが,各形態統語的カテゴリごとに定義されたタグの組み合わせによって構成されるためである.既存のアラビア語品詞タグ付けでは,各形態統語的カテゴリを独立に予測しており,各カテゴリを予測する上で有益な情報をカテゴリ間で共有できていなかった.本研究では,マルチタスク学習の枠組みを用いて,各形態統語的カテゴリを同時に予測する手法を提案する.また,入力語に対して各形態統語的カテゴリが取りうるタグを登録した辞書情報をモデルに組み込むことで,さらなる性能向上が得られることを示す.Penn Arabic Treebank を用いた評価実験の結果,これまでに報告されている最高性能の品詞タガーの正解率を上回ることを確認した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2017-NL-232, 号 8, p. 1-9, 発行日 2017-07-12 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |
Share
Cite as
井上, 剛, 進藤, 裕之, 松本, 裕治, 2017, アラビア語の高粒度な品詞タグ付けのための辞書情報を活用した形態統語的カテゴリの同時予測: 情報処理学会, 1–9 p.
Loading...