WEKO3
-
RootNode
アイテム
統計的文法獲得モデルのための部分木ブロック化サンプリング法
https://ipsj.ixsq.nii.ac.jp/records/92141
https://ipsj.ixsq.nii.ac.jp/records/92141c471987b-45e4-4904-90be-301f95c205b5
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-05-16 | |||||||
タイトル | ||||||||
タイトル | 統計的文法獲得モデルのための部分木ブロック化サンプリング法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Blocked Subtree Sampler for Statistical Grammar Induction | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学 | ||||||||
著者所属 | ||||||||
NTTコミュニケーション科学基礎研究所 | ||||||||
著者名 |
進藤, 裕之
松本, 裕治
永田, 昌明
× 進藤, 裕之 松本, 裕治 永田, 昌明
|
|||||||
著者名(英) |
Hiroyuki, Shindo
Yuji, Matsumoto
Masaaki, Nagata
× Hiroyuki, Shindo Yuji, Matsumoto Masaaki, Nagata
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 自然言語処理分野における統計的文法獲得では,確率文法モデルの学習にGibbsサンプリング法が広く用いられている.しかしながら,木構造データを扱う場合には,Gibbsサンプリング法のように変数の値を一つずつ順番に更新していく方法では局所解に留まりやすく,十分に尤度の高い解を得られないという問題がある.この問題を解決するために,我々は新たな部分木のブロック化サンプリング法を提案する.本手法は,データ中に現れる共通の部分木まとめてブロック化し,ブロックに含まれる変数の同時分布からサンプリングを行う.そして,その部分木ブロック化サンプラーを従来のマルコフ連鎖モンテカルロ法と組み合わせて交互に実行することにより,目的関数の最適解を効率良く探索することができる.シンボル細分化文脈自由文法を用いて統計的文法獲得の実験を行ったところ,提案手法は既存手法よりも尤度の高い文法規則が獲得できることを確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Gibbs sampler is widely used for statistical grammar induction in natural language processing. However, by sampling only one variable at a time, the sampler suffers from local optimum due to the strong dependency between variables of tree structure. In this paper, we propose blocked subtree sampler to tackle this problem. Our sampler collects the same type of subtrees for each iteration and updates them simultaneously. Further, our method iterates the blocked subtree sampler and conventional Markov chain Monte Carlo (MCMC) sampler alternately to find the optimal solution efficiently. The experimental results of grammar induction show that our method achieves better performance compared with conventional methods. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2013-MPS-93, 号 6, p. 1-6, 発行日 2013-05-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |