DIAVIS-wiki
INDEX #contents ---- *適合率(precision)と再現率(recall) [#eebad2bb] :適合性 relevance|適合する結果とは,ユーザにとって興味深く有益な結果のこと. :適合率 precision|適合するドキュメント「だけ」をどれくらい正しく検索できるかという度合いの評価 :再現率 recall|適合するドキュメント「すべて」をどれくらい正しく検索できるかという度合いの評価 適合率 = 検索結果内の適合データ数 / 検索結果データの総数 再現率 = 検索結果内の適合データ数 / 実際の適合データの総数 これらの測定基準は検索の種類によって重要度が相対的に変化する. :サンプル検索|役立つドキュメントが数件見つかれば事足りる種類の検索.適合率が再現率より重要. :|ほとんどのGoogleのユーザは,多数の[[フォルスドロップ]]を選別する手間をかけずに,手っ取り早く数件程度の結果が得られればよいと思っている. :存在検索|既知の項目や,特定のドキュメント(ウェブサイト)を見つけ出す必要がある検索.適合率がより重要. :全数検索|適合するドキュメントを全件(もしくはそれに近い件数)を引き出す必要がある種類の検索.再現率のほうが重要. **問題 [#hcf1f382] ***再現率の測定 [#k384081b] -あらかじめ,全データ内の適合データの総数を数えておかなければならない -データの母集団のサイズが大きくなるにつれて劇的に低下する *用語 [#i9b516f5] :アバウトネス| :統制語彙|図書館情報学の用語で,情報検索において索引語として利用する語を限定し,その意味の範囲や使用方法を規定したものの集まりを指す. *参考文献 [#pad2355b] -Peter Morville,アンビエント・ファインダビリティ,O'REILLY,2006 |