WEKO3
-
RootNode
アイテム
『日本語話し言葉コーパス』の設計の概要と書き起こし基準について
https://ipsj.ixsq.nii.ac.jp/records/48520
https://ipsj.ixsq.nii.ac.jp/records/4852039339f93-f818-4151-a4ca-a0699f94c7e2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-05-31 | |||||||
タイトル | ||||||||
タイトル | 『日本語話し言葉コーパス』の設計の概要と書き起こし基準について | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | The Corpus of Spontaneous Japanese : Its Design and Transcription Criteria | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
国立国語研究所研究開発部門第2領域 | ||||||||
著者所属 | ||||||||
国立国語研究所研究開発部門第2領域 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Language Research, National Institute for Japanese Language | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Language Resrach, National Institute for Japanese Language | ||||||||
著者名 |
小磯, 花絵
前川, 喜久雄
× 小磯, 花絵 前川, 喜久雄
|
|||||||
著者名(英) |
Hanae, Koiso
Kikuo, Maekawa
× Hanae, Koiso Kikuo, Maekawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度の下,自発性の高い話し言葉の情報処理技術の確立を目標に活動を進めている.現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している.このコーパスには,約700時間の音声(約700万形態素に相当),書き起こしテキスト,および形態素などの情報が含まれる予定である.本稿では,本コーパスの設計の概要および書き起こし基準の詳細について紹介する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A large-scale corpus of spontaneous Japanese speech is being compiled as a joint work of the National Institute for Japanese Language, the Communications Research Laboratory, and Tokyo Institute of Technology.This corpus is designed to contain about 700 hours of speech (about 7 million morphemes), its transcription, and various tagging information such as POS information. In this paper, the transcription criteria designed specifically for CSJ is described after a brief overview of the general architecture of the corpus. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2001, 号 54(2001-NL-143), p. 41-48, 発行日 2001-05-31 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |