DIAVIS-wiki
// [[:private]]
CONTENTS~
#contents
----

*背景 [#n9336cc7]
近年,ソーシャル・ネットワーキング・サービス(以下SNS)と呼ばれるオンライン・サービスが普及している.

-特徴
--相互認証に基づく明示的な「友人」関係
--「友人」の公開
--自己プロフィールの記述
--コミュニケーション支援
--コミュニティ形成支援


**問題 [#f16e268f]
-友人関係がみえにくい
-コミュニティの共起関係などがみえにくい

**できたら良さそうなこと [#pd3205fe]
***指定ユーザとの関係性の視覚化 [#qf8bc964]
-共通の友人の発見支援
-共通のコミュニティの発見支援
-友人の友人の発見支援
-指定のユーザまでの間のルート発見新(つないでくれる)

***みやん案 [#bcf016cc]
> 最近さ、マイミクの数と、そのマイミクさんのマイミク数とか、コミュニティへの参加数と、そのコミュニティの参加者数で、何となく社会性指数みたいのがでてきそうな気がしてさ。
マイミクが50人前後だと、そのマイミクのマイミクも50人前後の人が多い。 
数百人規模だと、そのマイミクも数百人規模が多かったりする。 
コミュニティの数は少ないが、人数が多いコミュニティに多く所属している人はマジョリティ層だしさ。 
なんかそういうのが見えてくるような気がした。

> ニーズ視点で考えるとあんまり処理や結果が複雑じゃない方がよいかなと思う。~
会社を作ってマーケティングを考える上でテーマにしているのが自意識というもの。自分の社会的な位置や、自分と他人との相性をmixiで手早く知ることができたら、気になる人がいるだろうなという感じなんだよね。 
つまりmixi占い、みたいな。~
マイミクの数と、マイミクの平均マイミク数をそれぞれ横軸・縦軸にとると、なんとなくクラスターが見えてくるんじゃないかなぁと直感したのがひとつ。~
もう一つは、ある気になる人がいて、共通のコミュニティとか共通マイミクの距離とかが指標化できるとおもしろいなぁと思ったり。 

*利用する情報 [#a164a88e]
一般的なSNSにも適用できるようにサービス依存を避けるほうが得策と考えられる.

+友人リスト
+コミュニティ
+アクティビティ
++アクセス状況
++日記投稿
++探索行為(他ユーザへの足あと)
++コメント活動


*データマイニング [#f5eefd6f]
**マッピング [#od948c51]
友達の共起数とコミュニティの共起数でマッピングする.

**クラスタリング [#aeb6474b]
クラスタリングを行うためには,レコード間の相違度(dissimilarity)が数値で算出相違度)f(A,B)で表すテーブルがあるとする.自分自身との相違度を0に設定.さらに,相違度f(A,B)たちが三角不等式とよばれる次の式が成り立とき,相違度はデータレコード間の距離(metric)になるという.
f(A,B) + f(B,C) >_ f(A,C)
また,f(A,B)=f(B,A)であるとき対称,そうでないとき非対称な相違度/距離という.

***関連キーワード [#ce0556c2]
-三角不等式(triangular inequality)
-距離の種類
--ユークリッド距離(Euclidean distance)
--編集距離(editing distance)
--キーワード距離(keyword distance)

**参考文献 [#q3f9178f]
-福田剛志,森本康彦,徳山豪,データサイエンスシリーズデータマイニング,共立出版,2001
#related

*TODO [#lb34bad5]
-友人/コミュニティの共起数の算出方法・実装方法
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS