WEKO3
-
RootNode
アイテム
単語分かち書き用辞書生成システムNEologdの運用-文書分類を例にして-
https://ipsj.ixsq.nii.ac.jp/records/176465
https://ipsj.ixsq.nii.ac.jp/records/1764651289330f-040a-4ba8-b73c-ade579ebddc6
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2016 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2016-12-14 | |||||||||||
タイトル | ||||||||||||
タイトル | 単語分かち書き用辞書生成システムNEologdの運用-文書分類を例にして- | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 言語資源の構築と利用 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
LINE株式会社Data Labs | ||||||||||||
著者所属 | ||||||||||||
LINE株式会社Data Labs | ||||||||||||
著者所属 | ||||||||||||
東京工業大学科学技術創成研究院未来産業技術研究所 | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Data Labs, LINE Corporation | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Data Labs, LINE Corporation | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Laboratory for Future Interdisciplinary Research of Science and Technology, Institute of Innovative Research, Tokyo Institute of Technology | ||||||||||||
著者名 |
佐藤, 敏紀
× 佐藤, 敏紀
× 橋本, 泰一
× 奥村, 学
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | SNS やニュース記事で発見される新語や未知語の継続的な採録は,分かち書き用の辞書を作成して更新する際の課題のひとつである.我々は,固有名詞や複合語に対する高い網羅性と分かち書き精度を実現し続ける際に,コーパスではなく辞書として言語資源を追加することを選択した.そして,形態素より長い固有名詞や複合語を単一の見出し語として分かち書きし,品詞情報や読み仮名などを付与できる辞書を生成するためのシステムを構築した.さらに辞書生成システムを運用して短い周期での更新を長期間継続した.我々は,形態素より長い固有名詞や複合語を一語として分かち書きすること,及び,辞書生成システムを運用して短い周期で更新することの各効果を,ニュース記事を複数のカテゴリに分類する実験を通じて確認した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2016-NL-229, 号 15, p. 1-14, 発行日 2016-12-14 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |