データセット
the Jester Online Joke Dataset
- http://www.ieor.berkeley.edu/~goldberg/jester-data/
- 7万3421人による100個のジョークに対する410万件の連続値評価(-10.00〜+10.00)
The MovieLens Dataset
- http://www.grouplens.org/node/12#attachments
- 6400人による3500本の映画に対する100万件の5段階評価(1-5)
- ミネソタ大GroupLens組が提供しているMovieLensシステムのデータ
The EachMovie Dataset
-
- 7万2916人による1628本の映画に対する281万1983件の5段階評価(1-5)
- HPのグループが作成したものだが、公開は終了してしまったらしい
The BookCrossing Dataset
- http://www.informatik.uni-freiburg.de/~cziegler/BX/
- 27万8858人による27万1379冊の本に対する114万9780件の11段階評価(0-10)
- bookcrossing.comというサイトのデータを2004年に4週間かけてクロールしたもの
- クロールしたCai-NicolasさんはGroupLens組のKonstanさんと共著関係
Research Resources for Recommender Systems
- http://www.patrickbaudisch.com/interactingwithrecommendersystems/WorkingNotes/JoeKonstanJohnRiedlResearchRecoucesForRecommenderSystems.pdf
- 推薦システムのための研究リソースについて紹介論文。GroupLens組。