2. 和歌データベースからの類似歌の自動抽出

   山崎真由美,竹田正幸,福田智子,南里一郎
  「情報処理学会研究報告」Vol.98, No.97, pp. 57-64, 平成10年10月

【要旨】
 和歌文学研究において,歌の類似性の抽出は重要である.歌の類似性に着目することにより,過去や同時代の歌人による作品への影響を明らかにすることができ,また歌人の個性や時代による特徴を獲得することができる.
 従来,この類の研究は,任意の歌もしくは表現にまず注目し,次にその用例を収集するという方法で進められてきた.だがもし,大量の和歌のデータの中から類似歌を自動抽出することができれば,その類似歌の発見が契機となって新たな視点が得られ,研究の大きな進展につながることも期待できるのである.
 本論文では,大量の和歌データを対象に,計算機による類似歌の自動抽出を目指し,そのために必要な類似性の指標を提案する.提案した指標は,最長共通部分列に基づく指標を改善したものである.本方式を用いて,「古今集」と「新古今集」からの類似歌抽出を試みたところ,類似度の高いものの多くは,実際に本歌取りであり,また,主な注釈書には指摘が漏れている本歌取りも指摘できることが判明した.