DIAVIS-wiki
#contents ---- *ウェーバー・フェヒナーの法則 [#e19da6b7] *オントロジー(Ontology) [#n89f84bc] *共起(Co-occurrence) [#yb6df7b0] >文書検索の研究分野では,複数の語が同じ文章中に出現することを数値化して,それを検索に利用する場合がある.この複数の語が同じ文書中に出現することを共起(co-occurrence)と呼ぶ.この共起の概念の具体例としては,ある文書集合に対して,aとb二つの語のAND検索を行い,その検索された文書数を共起情報とする手法である.つまり,語aを含む文書集合をA,語bを含む文書集合をBとした場合,共起は語aおよび語bをともに含む文書集合|A∩B|として与えられる.これを数値化する方法はさまざまだが,単純に|A∩B|を利用するよりは,集合の類似度を表現する[[Dice係数]]2|A∩B|/(|A|+|B|)や[[Simpson係数]]|A∩B|/min(|A|,|B|)などが用いられることが多い.一方,確立統計的な言語処理手法の一つにNグラム(N-gram)があるが,ここにも共起の概念は存在する.この分野での概念は上記で説明した概念とは若干異なり,あるテキスト全体を前から順に任意のN個の文字列または単語の組み合わせで分割したとき,その文字列または単語の組み合わせ自体のことを共起(collocation)と呼んでいる.(波多野賢治) :出典|「Webインテリジェンスとインタラクション」特集実行委員会編,「Webインテリジェンスとインタラクション用語集」,知能と情報(日本知能情ファジィ学会誌)Vol.18,No.2,pp.140-148(2006) *協調フィルタリング(Collaborative Filtering) [#he4d02ee] *検索モデル(Retrieval Model) [#h775a300] -ブーリアン検索モデル(Boolean Retrieval Model) --利点 ---実装が容易で高速な検索が可能 --欠点 ---検索結果をランキングできないため,利用者が必要な検索対象の発見が困難となる -拡張ブーリアン検索(Extended Boolean Retrieval Model) :|検索対象に含まれる問合せキーワードの数に応じてランキングを行うモデル -ベクトル空間モデル(Vector Space Model;VSM) :|1975年にSaltonらによって提案された方法 :|検索対象と問合せをそれぞれベクトル空間上に表現し,[[コサイン相関値]],内積,距離などを用いてベクトル間の相関値を求め,ランキングを行う方法. -ネットワークモデル -確立モデル *検索質問(Query) [#xcd2b90b] *検索質問拡張(Query Expansion) [#cebe05d2] *情報推薦/フィルタリング(Information Recommendation / Filtering) [#fb86ccb0] *情報抽出 [#vdc8ab84] *スケールフリーネットワーク(Scale-Free Network) [#ea43aa00] :|ネットワーク中のノードの次数と,その次数をとるノード数の関係がべき乗則(power law)に従うネットワーク. *スモールワールド(Small World) [#bbf36174] :| *適合フィードバック(Relevance Feedback) [#w3adb639] *適合率(Precision)と再現率(Recall)とF尺度(F-measure) [#b177f615] **F尺度 [#fcee00ba] -適合率と再現率はトレードオフの関係にある.両者を組み合わせた総合的な指標 ---- *参考資料 [#nce07e2d] +「Webインテリジェンスとインタラクション」特集実行委員会編,「Webインテリジェンスとインタラクション用語集」,知能と情報(日本知能情ファジィ学会誌)Vol.18,No.2,pp.140-148(2006) |