Item type |
Symposium(1) |
公開日 |
2019-12-07 |
タイトル |
|
|
タイトル |
唐詩の構造化に関する研究:テキストの差異提示機能の検討 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Prototype of Collation for Tang Poems |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Tangpoem; collation; full text; digitization |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
筑波大学 |
著者所属 |
|
|
|
筑波大学 |
著者所属(英) |
|
|
|
en |
|
|
University of Tsukuba, University of Tsukuba |
著者名 |
叢, 艶
高久, 雅生
|
著者名(英) |
Yan, Cong
Masao, Takaku
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
筆者らは唐詩作品のLOD化および本文およびフルテキストのTEIマークアップに関わる研究を行ってきた.本研究では,それらの研究成果を踏まえて,同一の唐詩作品Workにおける唐詩作品のインスタンス同士の異なる表現を比べ合って,同じ唐詩作品Workに属するInstanceの間の差異を提示する機能を検討する.唐詩作品の校合対象については唐詩作品の(1)タイトル,(2)訓点情報,(3)漢字,(4)漢字の順序がある.本研究の比較方法は,LCS(Longest Common Subsequence)アルゴリズムによる差分検出であり,差分の結果の表現は,HTMLおよびCSSと組み合わせて,利用者が直接見られるようにする.結果としては,唐詩作品のインスタンス同士に存在する差異をそれぞれ表し,校合テキストを結果として,提示する. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
We did the researches on the Linked Open Data of Tang Poems and the TEI Markup for the Content of Tang Poems in the past. Based on the previous research outcomes, we aim at developing a prototype of collation for Tang Poems to let people find the difference between the tang poem's instances intuitively. At first, we compare the differences of Tang Poem's Instances which are belong the same Tang Poem's Work. Then we show the results of differences. The targets of collation for Tang poems are as follows, (1) Title, (2) Kunten information, (3) Kanji Characters, (4) the order of the characters in a sentence. We use the method of longest common subsequence algorithms to collate the poems, and we also show the the results of differences with HTML and CSS. |
書誌情報 |
じんもんこん2019論文集
巻 2019,
p. 273-280,
発行日 2019-12-07
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |