DIAVIS-wiki
  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[論文の書き方について]]
 
 #contents
 ----
 
 *オントロジー(Ontology) [#n89f84bc]
 *共起(Co-occurrence) [#yb6df7b0]
  文書検索の研究分野では,複数の語が同じ文章中に出現することを数値化して,それを検索に利用する場合がある.この複数の語が同じ文書中に出現することを共起(co-occurrence)と呼ぶ.この共起の概念の具体例としては,ある文書集合に対して,aとb二つの語のAND検索を行い,その検索された文書数を共起情報とする手法である.つまり,語aを含む文書集合をA,語bを含む文書集合をBとした場合,共起は語aおよび語bをともに含む文書集合|A∩B|として与えられる.これを数値化する方法はさまざまだが,単純に|A∩B|を利用するよりは,集合の類似度を表現するDice係数2|A∩B|/(|A|+|B|)やSimpson係数|A∩B|/min(|A|,|B|)などが用いられることが多い.一方,確立統計的な言語処理手法の一つにNグラム(N-gram)があるが,ここにも共起の概念は存在する.この分野での概念は上記で説明した概念とは若干異なり,あるテキスト全体を前から順に任意のN個の文字列または単語の組み合わせで分割したとき,その文字列または単語の組み合わせ自体のことを共起(collocation)と呼んでいる.(波多野賢治)
 -「Webインテリジェンスとインタラクション」特集実行委員会編,「Webインテリジェンスとインタラクション用語集」,知能と情報(日本知能情ファジィ学会誌)Vol.18,No.2,pp.140-148(2006)
 >文書検索の研究分野では,複数の語が同じ文章中に出現することを数値化して,それを検索に利用する場合がある.この複数の語が同じ文書中に出現することを共起(co-occurrence)と呼ぶ.この共起の概念の具体例としては,ある文書集合に対して,aとb二つの語のAND検索を行い,その検索された文書数を共起情報とする手法である.つまり,語aを含む文書集合をA,語bを含む文書集合をBとした場合,共起は語aおよび語bをともに含む文書集合|A∩B|として与えられる.これを数値化する方法はさまざまだが,単純に|A∩B|を利用するよりは,集合の類似度を表現する[[Dice係数]]2|A∩B|/(|A|+|B|)や[[Simpson係数]]|A∩B|/min(|A|,|B|)などが用いられることが多い.一方,確立統計的な言語処理手法の一つにNグラム(N-gram)があるが,ここにも共起の概念は存在する.この分野での概念は上記で説明した概念とは若干異なり,あるテキスト全体を前から順に任意のN個の文字列または単語の組み合わせで分割したとき,その文字列または単語の組み合わせ自体のことを共起(collocation)と呼んでいる.(波多野賢治)
 :出典|「Webインテリジェンスとインタラクション」特集実行委員会編,「Webインテリジェンスとインタラクション用語集」,知能と情報(日本知能情ファジィ学会誌)Vol.18,No.2,pp.140-148(2006)
 
 *協調フィルタリング(Collaborative Filtering) [#he4d02ee]
 
 *検索モデル(Retrieval Model) [#h775a300]
 -ブーリアン検索モデル(Boolean Retrieval Model)
 --利点
 ---実装が容易で高速な検索が可能
 --欠点
 ---検索結果をランキングできないため,利用者が必要な検索対象の発見が困難となる
 
 -拡張ブーリアン検索(Extended Boolean Retrieval Model)
 :|検索対象に含まれる問合せキーワードの数に応じてランキングを行うモデル
 
 -ベクトル空間モデル(Vector Space Model;VSM)
 :|1975年にSaltonらによって提案された方法
 :|検索対象と問合せをそれぞれベクトル空間上に表現し,[[コサイン相関値]],内積,距離などを用いてベクトル間の相関値を求め,ランキングを行う方法.
 
 -ネットワークモデル
 -確立モデル
 
 *検索質問(Query) [#xcd2b90b]
 *検索質問拡張(Query Expansion) [#cebe05d2]
 *情報推薦/フィルタリング(Information Recommendation / Filtering) [#fb86ccb0]
 *情報抽出 [#vdc8ab84]
 *スケールフリーネットワーク(Scale-Free Network) [#ea43aa00]
 :|ネットワーク中のノードの次数と,その次数をとるノード数の関係がべき乗則(power law)に従うネットワーク.
 *スモールワールド(Small World) [#bbf36174]
 :|
 *適合フィードバック(Relevance Feedback) [#w3adb639]
 *適合率(Precision)と再現率(Recall)とF尺度(F-measure) [#b177f615]
 **F尺度 [#fcee00ba]
 -適合率と再現率はトレードオフの関係にある.両者を組み合わせた総合的な指標
 ----
 *参考資料 [#nce07e2d]
 +「Webインテリジェンスとインタラクション」特集実行委員会編,「Webインテリジェンスとインタラクション用語集」,知能と情報(日本知能情ファジィ学会誌)Vol.18,No.2,pp.140-148(2006)
 
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS