DIAVIS-wiki
:private ベクトル空間法 各レシピを文書(Document)と見なすと,レシピに使用されている食材は文書内で使用されているキーワードとみなすことができる. ・データベースをレシピの集合とみなす. DB = { R1, R2, ... , Rn } ・レシピを食材の集合とみなす. {Ri} = { I1, I2, ... In } ・個々の食材を評価する. 食材Iiが特定のレシピRiにしか出現しない → Iiの評価は高い 食材Iiが全てのレシピに出現する → Iiの評価は低い 食材Iiが全てのレシピに出現する → Iiの評価は低い 文書と索引語の場合は,索引後の出現頻度を考慮するが,レシピの場合には,分量を考慮する. ・食材評価 = log( 総レシピ数/出現レシピ数) + 1 *作業手順 [#t9f1ae36] +個々のレシピからベクトル表を作成 +ベクトル表を総合してマスタベクトル表を作成? --食材が使用されるレシピ数を計算する +マスタベクトル表にIDFを付加する. -- idf = log( N / df ) + 1 ---DB(レシピ集合)全体から見た食材の重要性 +個々のレシピのベクトル表に TF-IDFを付加する --tf-idf = tf * idf ---個々のレシピから見た食材の重要性 TF・IDF 動きによる視覚化 |