DIAVIS-wiki
:private

ベクトル空間法

各レシピを文書(Document)と見なすと,レシピに使用されている食材は文書内で使用されているキーワードとみなすことができる.

・データベースをレシピの集合とみなす.
DB = { R1, R2, ... , Rn }

・レシピを食材の集合とみなす.
{Ri} = { I1, I2, ... In }

・個々の食材を評価する.
	食材Iiが特定のレシピRiにしか出現しない	→ Iiの評価は高い
	食材Iiが全てのレシピに出現する		→ Iiの評価は低い

文書と索引語の場合は,索引後の出現頻度を考慮するが,レシピの場合には,分量を考慮する.


・食材評価 = log( 総レシピ数/出現レシピ数) + 1


*作業手順 [#t9f1ae36]
+個々のレシピからベクトル表を作成
+ベクトル表を総合してマスタベクトル表を作成?
--食材が使用されるレシピ数を計算する
+マスタベクトル表にIDFを付加する.
-- idf = log( N / df ) + 1 
---DB(レシピ集合)全体から見た食材の重要性
+個々のレシピのベクトル表に TF-IDFを付加する
--tf-idf = tf * idf
---個々のレシピから見た食材の重要性



TF・IDF

動きによる視覚化
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS