1. MDL原理を用いた和歌データからのパターン抽出

   竹田正幸,山崎真由美,福田智子,南里一郎
 「情報処理学会研究報告」Vol.98, No.11, pp. 29-34, 平成10年1月

【要旨】
 本研究は,和歌の集合から表現の特徴を抽出することを目的とする.特徴として付属語のなすパターンを扱う.そこで,和歌の集合に対してその被覆となるパターンの集合を求める問題を考える.Brazmaらは,与えられた文字列の集合に対する最適な被覆をMDL原理に基づいて定義した.その定義は,パターンの記述長とパターンを用いて符号化された文字列の記述長の和を最小にする被覆を最適とするものである.本研究では,5つの歌集(「古今集」「新古今集」「壬二集」「拾遺愚草」「山家集」)を対象にこの手法を用いてパターンの抽出の実験を行ない,その有効性を検証した.