WEKO3
-
RootNode
アイテム
部分統語構造を考慮した階層的確率オートマトンに基づく教師なしチャンキング
https://ipsj.ixsq.nii.ac.jp/records/101909
https://ipsj.ixsq.nii.ac.jp/records/1019099427b218-8a8b-4008-87bb-b8fc21e623d8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2014 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2014-06-30 | |||||||
タイトル | ||||||||
タイトル | 部分統語構造を考慮した階層的確率オートマトンに基づく教師なしチャンキング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Unsupervised Chunking with Partial Syntactic Analysis Using Hierarchical Probabilistic Automaton | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [研究論文] 教師なしチャンキング,部分構文解析,階層型隠れマルコフモデル | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
筑波大学図書館情報メディア系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Library, Information and Media Science, University of Tsukuba | ||||||||
著者名 |
若林, 啓
× 若林, 啓
|
|||||||
著者名(英) |
Kei, Wakabayashi
× Kei, Wakabayashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | チャンキングは,単語の系列から名詞句や前置詞句といった浅い統語構造を抽出する技術であり,固有表現抽出や機械翻訳などで重要な前処理であると考えられている.これまでに提案されている多くのチャンキング手法は教師あり学習に基づいており,教師データに現れない文章表現を多く含むWeb上の文書には適用が難しい.本研究では,依存構造解析モデルの平坦近似に基づいた平坦近似依存文法モデル(FADG)を用いることで,チャンク間の局所的な統語構造を考慮した教師なしチャンキング手法を提案する.FADGは線形鎖モデルを階層的に接続した階層型隠れマルコフモデル(HHMM)の枠組みで形式化するため,HHMMの効率的な教師なし学習アルゴリズムを適用できる.実験により,提案モデルが局所的な統語構造を効果的に推定し,これによって高い精度で教師なしチャンキングを行えることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Chunking is a natural language processing task to extract shallow syntactic structures like noun phrases or prepositional phrase, and it plays an important role in various applications such as named entity extraction and machine translation. Most chunking algorithms proposed so far are based on supervised learning, but they depend on the domain of supervision documents that often consist of news articles and are not effective for analyzing Web documents or microblogs. In this paper, we propose an unsupervised chunking method based on the Flat Approximated Dependency Grammar model (FADG) to capture local syntactic dependency structures between chunks. The FADG is formalized as a Hierarchical Hidden Markov Model (HHMM) and we can conduct the unsupervised learning of FADG efficiently by using a sophisticated inference algorithm for HHMMs. The experimental results show the effectiveness of the proposed method in chunking accuracy comparison. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 7, 号 2, p. 61-69, 発行日 2014-06-30 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |