WEKO3
-
RootNode
アイテム
単語翻訳モデルを用いた翻訳後編集による湧き出し語対策
https://ipsj.ixsq.nii.ac.jp/records/10263
https://ipsj.ixsq.nii.ac.jp/records/1026388cbbb56-43a3-4cda-b77b-6d1003f7f7ac
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-06-15 | |||||||
タイトル | ||||||||
タイトル | 単語翻訳モデルを用いた翻訳後編集による湧き出し語対策 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Post-edit of Machine Translation Using a Lexicon Model to Cope with Out-of-the-blue Words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:情報処理技術のフロンティア | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語 | |||||||
著者所属 | ||||||||
ATR 音声言語コミュニケーション研究所 現在,株式会社CSK システムズ,神戸大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
ATR 音声言語コミュニケーション研究所 現在,独立行政法人情報通信研究機構,神戸大学大学院自然科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Communication Research Laboratories,Presently with CSK Systems Corporation and Graduate School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Communication Research Laboratories,Presently with National Institute of Information and Communications Technology and Graduate School of Science and Technology, Kobe University | ||||||||
著者名 |
土居, 誉生
隅田, 英一郎
× 土居, 誉生 隅田, 英一郎
|
|||||||
著者名(英) |
Takao, Doi
Eiichiro, Sumita
× Takao, Doi Eiichiro, Sumita
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | コーパスベース翻訳は高い翻訳品質を実現しうる有望な技術である.しかし,入力文と関連のない語が訳文に湧き出すなど,特徴的な翻訳誤りも観察される.本稿では,この湧き出し誤りへの対処として,後編集により自動修正するアプローチを提案する.提案手法は,単語翻訳モデルを利用して誤り語候補を検出し,修正処理を起動する.誤り語候補は,対訳コーパスから得られた用例を利用した制約の検証を経て,訳文から削除される.日英および中英翻訳を対象とした複数のシステムを使った実験で,誤り語自動削除による翻訳精度向上効果が確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Although corpus-based machine translation is a promising technology, one error that is typically observed is out-of-the-blue words, i.e., words that appear in the translation that are unrelated to the input information. Our approach to correct the error is an automatic postedit of the translations. The proposed method finds error clues based on a lexicon model and triggers the correction process. The error words derived from the clues are deleted from the translation after a constraint check using translation examples. We conducted an experiment using several translation systems on Japanese-to-English and Chinese-to-English translations, whose results showed improvement on translation accuracy by automatically deleting unrelated words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 47, 号 6, p. 1742-1752, 発行日 2006-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |