Item type |
Symposium(1) |
公開日 |
2018-11-24 |
タイトル |
|
|
タイトル |
日本語文献史料の構造化記述のための軽量マークアップ言語の開発 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Light-weight Markup Language for Structured Description of Japanese Historical Documents |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
歴史的典籍\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
軽量マークアップ言語\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
解析表現文法\n |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
TEI |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
国立歴史民俗博物館 |
著者所属 |
|
|
|
慶應義塾大学 / 日本学術振興会 |
著者所属(英) |
|
|
|
en |
|
|
National Museum of Japanese History |
著者所属(英) |
|
|
|
en |
|
|
Keio University / Japanese Society for the Promotion of Science |
著者名 |
橋本, 雄太
宮川, 真弥
|
著者名(英) |
Yuta, Hashimoto
Shinya, Miyagawa
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
歴史文献史料を構造化されたデータとして扱うためには,何らかの機械処理可能なマークアップ言語を用いて翻刻文を記述することが望ましい.加えて人文学研究者やクラウドソーシング参加者が利用するためには,そのような言語は簡潔かつ可読性の高い文法で記述される必要がある.そこで,古文書や古記録,古典籍といった日本語文献史料を記述するための軽量マークアップ言語を開発した.この言語の文法を形式文法のひとつである解析表現文法によって定義し,また縦書き入力やシンタックスハイライトに対応したオンラインエディタを開発した.このような入力負荷の低いマークアップ言語が普及することで,クラウドソーシングによる史料翻刻や,文献史料のデータベース化が効率的に進むことが期待される. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In order to process historical documents as semi-structured data, it is desirable that the transcriptions of those documents are encoded with some sort of machine-readable markup languages. In addition, for the use by humanities scholars and crowdsourcing project participants, such a language needs to have concise and readable grammars. Koji is a light-weight markup language that we have developed for the encoding of pre-modern Japanese documents. It has a simple and readable syntax prescribed with Parsing Expression Grammars (PEG), a type of analytical formal grammars. We also developed a web-based editor for Koji that supports syntax highlighting, snippet insertion, and so on. |
書誌情報 |
じんもんこん2018論文集
巻 2018,
p. 237-242,
発行日 2018-11-24
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |