WEKO3
-
RootNode
アイテム
機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築
https://ipsj.ixsq.nii.ac.jp/records/82618
https://ipsj.ixsq.nii.ac.jp/records/826181e1c4e91-b4b0-4881-9103-047bc8280796
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-06-15 | |||||||
タイトル | ||||||||
タイトル | 機械翻訳の品質向上のための対訳コーパスからの統計的前編集システムの自動構築 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Construction of Statistical Pre-editing System from Parallel Corpus for Improvement of Machine Translation Quality | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [一般論文] 統計的前編集,書き換え,学習データ選択,機械翻訳 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属 | ||||||||
龍谷大学理工学研究科 | ||||||||
著者所属 | ||||||||
龍谷大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Technology, Ryukoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Technology, Ryukoku University | ||||||||
著者名 |
南條浩輝
山本, 祐司
吉見, 毅彦
× 南條浩輝 山本, 祐司 吉見, 毅彦
|
|||||||
著者名(英) |
Hiroaki, Nanjo
Yuji, Yamamoto
Takehiko, Yoshimi
× Hiroaki, Nanjo Yuji, Yamamoto Takehiko, Yoshimi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 機械翻訳(MT)の品質向上のための翻訳前の書き換え(前編集)について述べる.これまでの前編集は主にルールに基づくものであるため,MTシステムに依存し,かつシステム構築に労力を要した.これに対し,本論文では,MTシステムに依存しない統計的前編集システムの自動構築手法を提案する.具体的には,対象とするMTシステムに適した前編集システムを,当該MTシステムを含む複数のMTシステムおよび対訳コーパスから自動構築する手法を提案する.本手法の最も重要な特徴は,前編集によって翻訳品質の向上が得られる学習データを自動生成できる点にある.ロイター日英記事の対応付けデータを用いて4種類の日英MTシステム用前編集システムを構築したところ,3種類のMTシステムについて,多くの文に対して翻訳品質を向上させる前編集システムが構築できた.提案手法である前編集システムの学習データの自動生成は,3種類のMTシステムの前編集システム構築に効果的であったこと,および他の1種類のMTシステムの前編集システム構築に悪影響がなかったことを示し,提案手法の有効性を示した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Rewriting before machine translation (MT), namely pre-editing, is addressed. Most of conventional pre-editings are MT dependent rule-based systems, and construction of such systems costs too much. In this paper, we propose an automatic construction method of MT independent statistical pre-editing systems. Specifically, for a specific MT system, statistical pre-editing system is trained with appropriate training data which are automatically generated with parallel corpus and some MT systems including the target MT system. Using Reuters Japanese-English parallel corpus, effective pre-editing systems were automatically constructed for several Japanese to English MT systems. We showed the effectiveness of the proposed method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 53, 号 6, p. 1644-1653, 発行日 2012-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |