7. 和歌データからの類似歌発見のための類似性指標について

   玉利公一,竹田正幸,福田智子,南里一郎
 「情報処理学会研究報告」Vol.2000 No.8, pp. 81-88, 平成12年1月

【要旨】
 本歌取りとは,特定の歌をふまえて新しい歌を作る作歌手法をいう.本歌取りの半自動抽出を行なうための有効な方法としては,まず,和歌間の類似性指標を定義し,その指標の値の大きい和歌の対を人手により検証する,といった方式が考えられる.そして,この方式が成功するか否かは,いかに類似性指標を定義するかにかかっている.著者らは,以前に最長共通部分列(LCS)の長さを用いた指標を変更することにより,新しい指標を提案し,それが本歌取りの半自動抽出に有効であることを示した.しかし,本歌取りには様々な本歌のふまえ方があるため,類似性指標はむしろ,研究者の視点に応じて自由に変更できることが望ましい.そこで本稿では,類似性指標を自由に設計するための共通の土台となる統一的枠組みを提唱する.この枠組みでは,指標を,パターン集合とパターンにスコアを与える関数の対によって表し,二つの文字列間の類似度を,その共通パターンの最大スコアとして定義する.このため,このもとで設計したおのおのの指標は,直感的に把握しやすいという利点がある.この枠組みのもとで,具体的にいくつかの指標を提示し,本歌取りの半自動抽出の観点から評価する.