第三回ソーシャルブックマーク研究会の感想


講演を聴いての感想とか

エコメンデーション

 協調フィルタリングの手法に対してクラスタを代表する代表ユーザの概念を入れて計算量を削減しましょうという感じでした.ソーシャルブックマークではなく情報推薦という方向から見た方がわかりやすそう.推薦に使うデータは増えていく一方なのにできるだけ最新の情報で推薦したいために計算時間,計算コストの削減は重要ということですね.

 ソーシャルブックマークがなぜ流行らないかということについて,ニーズが無いからだという話も.自分の周りでも人気記事のランキングとしてTwitterのBOTをフォローしてる人とかは居ますが,自分で使ってる人はあんまり居ませんね.私自身も昔はヘビーユーザーだったんですが,最近は昔ほど使ってない感じですし.ソーシャルな部分が意外と疲れるものでした.

SBMの推薦アルゴリズム ~はてなブックマークのレコメンド(関連エントリ)の仕組み~

講演者の方が所属するPFIという会社は学生ベンチャーらしいです.既にいくつもの大手にシステムを納入済みということで凄いなあ.

  • 全文検索エンジン:Sedue
  • レコメンドシステム:Hotate,Reflexa
  • 東大辻井研

どのように推薦しているかを詳しく説明してもらえて良かったのです……が,アルゴリズムの詳細は読み込まないとまだよく理解できてません.

以下メモ

  • Google sets
    • United statesとjapanを入れると国を探そうとしてるんだろうなということを推測するみたいなエンジン.
    • これは結構面白い
      • けど試してみた感じではあんまり自分の望むものは推薦されないなあ

アルゴリズム

SBMはデータがきれいでスパムが少ないからデータセットとして扱いやすい.

SBMはミニブログです。

「Twitterは検索性が悪いからはてなブックマークでTwitterと同じことをすれば検索性が上がって良い」というコンセプトでした.

 が,Twitterのようにはてなブックマークを使うと,URLはダミーなので検索には使えないし発言ごとにタグを書くということは(少なくとも今Twitterを使っている自分には)考えられないので,結局コメント部分の全文検索が使えるだけじゃないのかなと思いました.今ひとつメリットが見えなかったので,同じ前提からだと「ソーシャルブックマークを無理矢理ミニブログとして使おう」ではなく「検索に強いミニブログを作ろう」の方がより良いアプローチなのではないかなと思いました.

SBMを利用したフィッシングサイト検知とその展望 -集合知セキュリティという考え方-

 ソーシャルブックマークに登録されていなければフィッシングサイトであると疑う考え方を導入することで,フィッシング業者に新たに作成したフィッシングサイトをソーシャルブックマークに登録させ,それを元にソーシャルブックマークサービス提供者がフィッシング業者のブラックリストを作るといいという考えでした.
 完全な無秩序(誰もどこに何があるかわからない現状のWeb)から管理された無秩序(最低限商売したり人を騙したりしようと考えた時にソーシャルブックマークにそのURLを登録している状態)に移せば次の展開が見えてくるのではないかという思想.

言語表現に基づくブックマークコメントの分類とフィルタリング

 ブックマークの内容を「要約」,「引用」と「意見・感想」に分類する手法をどうやっているのか気になっていたのですが,文末表現を取るなどのオーソドックスなやり方みたいです.評価表現を入れたいということでしたが,評価表現を取ろうとするといきなり難易度が跳ね上がるのですよね.
 コメント記入率の調査で大体40%ぐらいのコメント率になっていたのですが,はてなブックマークの人気エントリに入っていてブックマーク数が100件以上のものが対象なので,ブックマーク数が20以下とかを見るともっと少なくなるんじゃないかなあと思いました.

ソーシャルブックマークを加速する、イベント通知APIの可能性と実装

 講演者の方は,Livedoor Readerとかの中の人らしいです.Livedoor Readerは普段使っているので,開発者の方の話が聞けたのは嬉しかったです.
 PubSubHubBubとかWebHookとか名前しか聞いたことが無い話が色々出てて,やっぱり先端の所でやってる人はちゃんと新技術の動向を掴んでやっていってるんだなあと思ってもっと調べないといけないと思いました.大まかな方向としては,「あらゆる情報が流れ更新されていくストリーム」から「自分の欲しいサブストリーム」を取り出したいといった感じに見えました.そして,そういう方向にLivedoor Readerを更新していくと.
 今度のLivedoor Readerなどのアップデートでその辺りを実現する機能が実装されていくらしいのでどんな風になるのか楽しみです.

 PubSubHubBubって前に名前を見た時はリアルタイムとかストリームとか書いてあったのでCometみたいなちょっと違和感を感じるやり方の話なのかなと思ったんですがあらかじめURLを登録しておけば更新があった時にそのURLを引数付きで呼び出してくれるみたいな感じの仕組みなんですね.使うだけなら簡単そうだし面白そうです.

SocialDict – 英文Webページのスマートな注釈・辞書引きシステム

資料:http://www.slideshare.net/niammain/socialdict-sbm

 ソーシャルブックマークでよくやられている情報推薦と同じように,未知英単語の推測をTOEICとかで使われている学習モデルを活用してやりましょうという感じ.マウスオーバー辞書と違うのは意味があらかじめ展開されている点.システムは結構面白そうでした.
 聞き慣れない単語が色々出てきたので調べておかないと.SVMと比べて遜色ない結果というのは凄い.

  • IRT(項目応答理論)
    • Rasch
      • LOGRES(資料無し)
  • Google 1-gram

ブックマークサービス普及のためのユーザーインターフェース(UI)

発表資料は2009/09末頃を目標にTechBlogにアップするとのことです.

 プレゼンに対する実況Twitterでのブーイングが結構凄かったです.自分に対して言われていたわけではないのにちょっと辛かったです.ああいう場は向いてないのかもしれません.
 内容は,既存のソーシャルブックマークという枠組みにはめて考えるのではなく,利用する人が使いたい,見ただけで使える,使いたくなるようなサービスを提供する方法を考えようみたいな感じでした.
 「アフォーダンスのあるソーシャルブックマークのUI」が提示されなかったのはちょっと残念でしたが,Yahoo!ブックマークがリニューアルした際にはそのようなUIが適用されているとのことなので気長に待つことにします.

oneclip – Twitterでソーシャルブックマーク

OneClip:http://oneclip.jp/

 最初どうももやもやしていたんですが,bit.lyとかtinyurlの連なりなんですね.
短縮URLを開くとフレームで対象のページが覆われているのは,複数のURLをまとめるサービスで見たことがあったんだと今思い出しました.
 事前に講演一覧を読んだ時にどうしても気になっていた著作権について質問したのですが,既存サービスベースで企画したので法律関連は調査中との回答でした.著作物を不当に扱っているようには見えないのでそういう方面で問題が無いといいなあ.
 ただ,もしうまく普及したとして,本来のサイトがフレームに覆われている作りが脊椎反射のメディア*2のTwitterではフィッシングとかに悪用されないかなと思います.短縮URLを展開する時に本来のURLが末尾に追加されるようにはなっているのはそういう問題に対応する意味もあるとは思うのですが十分なのかはわかりません.

*1 : Google setsの内部アルゴリズムは不明だけど

*2 : と私が勝手に思ってるだけですが

Leave a Comment


NOTE - You can use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>