小野マトペの業務日誌(アニメ制作してない篇)

はてなダイアリーの閉鎖をうけ、旧ブログ http://d.hatena.ne.jp/ono_matope/ から移行しました。続きは→ http://matope.hatenablog.com/

Twitterの全自動まとめサイトもどきの『ふぁぼったー』を作ったよ!

UPDATE: ふぁぼったーの最新情報は[ふぁぼったー] - 小野マトペの業務日誌(アニメ制作してない篇)をご覧下さい。


large;font-weight:bold;">ふぁぼったー:http://favotter.matope.com/

なにこれ?

TwitterでFavoriteされた発言をあつめて、ちょっぴりまとめブログっぽいノリで全自動でまとめるサイトだよ!*1



ユーザーの人はご存知の通り、Twitterでは、気に入った発言の☆を押す(favoriteする)事で、周りのユーザーの面白い発言をストックする事が出来ます。色んな人のFavoriteを覗いて回るのが楽しかったりします。
じゃあ、沢山のユーザーのfavをあつめたら、Twitterの面白いところが濃縮出来るんじゃないかなー?と考えて作ってみました。個人的には、Twitterにちらばっている、破壊力の強い言葉を集められればいいなーと思います。

もうちょっと詳しく

favを収集している対象。

本当は、収集結果の豊かさを確保するために何千人くらいの規模でfavoをサンプリングしたかったんだけど、APIの発行数に限界があるので、アクティブユーザーを中心に採取した5500人の母集団の中から、fav数の多い上位250人をサンプルとしてます。でも下限の人のfav数は230くらいなので、積極的にfavしてる人は大体入ってる筈。この250人も固定ではなく、数日掛けて少しずつ入れ替わっていくと思います。
250人ではいかにも少ない、と思われるかもですが、5500人のサンプルで統計を取った結果、favoriteを使っている人は50%程度だったりしたので、そんなものかもしれません。もちろん、サンプルは多ければ多いほど収集結果は豊かになると思うので、色々サンプルを増やす仕組みは考えていこうと思っています。


余談ですが、このサービスを作るにあたって、Twitterの運営に、「こういうサービスを作りたいからAPI規制を解除してくれ」とメールを出したら、「今規制値を引き上げる方法を考えてるから、ちょっとまってね」と言われてしまいました。ドキュメントには相談してくれって書いてあったのに…!

favに反映されるのは、発言してから3時間まで

です。これはAPIの構造上、時間制限を設けるしかありませんでした。そのほか、もろもろでデータが抜け落ちたりもするので、favの数字は結構ルーズです。ご容赦。

protectedユーザーの扱い

protectedユーザーは、発言、fav共に収集してないです。本当はAPIから取得出来るんですが、そういう観測のされ方を好まないからプロテクトを掛けていると思うので、自重しました。

AutoPagerize対応

しました!


以上簡単ではありますが、どうぞご利用ください!

*1:半自動だとの説あり