DIAVIS-wiki
// [[:private]]
CONTENTS~
#contents
----

*背景 [#n9336cc7]
近年,ソーシャル・ネットワーキング・サービス(以下SNS)と呼ばれるオンライン・サービスが普及している.

-特徴
--相互認証に基づく明示的な「友人」関係
--「友人」の公開
--自己プロフィールの記述
--コミュニケーション支援
--コミュニティ形成支援


**問題 [#f16e268f]

**できたら良さそうなこと [#pd3205fe]

*利用する情報 [#a164a88e]
一般的なSNSにも適用できるようにサービス依存を避けるほうが得策と考えられる.

+友人リスト
+コミュニティ
+アクティビティ
++アクセス状況
++日記投稿
++探索行為(他ユーザへの足あと)
++コメント活動


*データマイニング [#f5eefd6f]
**マッピング [#od948c51]
友達の共起数とコミュニティの共起数でマッピングする.

**クラスタリング [#aeb6474b]
クラスタリングを行うためには,レコード間の相違度(dissimilarity)が数値で算出相違度)f(A,B)で表すテーブルがあるとする.自分自身との相違度を0に設定.さらに,相違度f(A,B)たちが三角不等式とよばれる次の式が成り立とき,相違度はデータレコード間の距離(metric)になるという.
f(A,B) + f(B,C) >_ f(A,C)
また,f(A,B)=f(B,A)であるとき対称,そうでないとき非対称な相違度/距離という.

***関連キーワード [#ce0556c2]
-三角不等式(triangular inequality)
-距離の種類
--ユークリッド距離(Euclidean distance)
--編集距離(editing distance)
--キーワード距離(keyword distance)

**参考文献 [#q3f9178f]
-福田剛志,森本康彦,徳山豪,データサイエンスシリーズデータマイニング,共立出版,2001
#related

*TODO [#lb34bad5]
-友人/コミュニティの共起数の算出方法・実装方法
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS