Google News 的个性化推荐策略
时间:2007-06-14 来源:guoxi
最近发表在 www'07 上的一篇文章 “Google News Personalization: Scalable Online Collaborative Filtering" 提出了一种新闻个性化推荐的方法,跳出了分析新闻内容的方法,感觉上看应该很好用,至少不用和自然语言理解(NLP)这种一般人看见就头疼的方法联系在一起。也给了我们一些提示,有的时候解决与内容相关的问题,从理解内容的角度出发也许并不是一种很好的方法,有时,从另一个角度出发,同样可以很好地解决问题。这篇 www'07 的文章是 Google 里的人写的,所以也许更有实际意义一些。
新闻的个性化推荐就是根据用户的兴趣把一些相关的新闻推荐给用户,这样用户就可以从眼花缭乱的新闻链接浏览中解放出来。
比较传统的做法是把新闻按内容分类,然后根据用户对某类新闻的感兴趣程度,把比较热门的新闻推荐给用户。且不说这样做的分类依据是什么,分类效果怎么样,这种方法本身就有一种假设偏置,因为它解决不了这样一个问题,用户没有涉足的新闻类别就一定是他不感兴趣的吗?答案当然是否定的。
所以,这篇文章根据用户点击新闻的历史,把用户聚类,让与这个用户有着同样兴趣的其他用户帮助完成个性化推荐的过程,通过划分用户群体来确定用户对某篇文章的感兴趣程度。
某个用户对某篇文章的感兴趣程度是这样计算的:
r(ua, sk) = sigma[ci:ua in ci] w(ua, ci) * sigma[uj:uj in ci] I(uj, sk)
r(ua, sk): sk 这篇文章对用户 ua 的可推荐度;
w(ua, ci): ua 属于 ci 这个用户群体的隶属程度;
I(uj, sk): 用户群 ci 中的某个用户 uj 是否点击了 sk 这条文章,点击了 sk = 1,否则 sk = 0。
在实现这个个性化推荐方法的时候,需要根据用户点击新闻的历史记录把用户聚类。 用到了 MinHash, LSH, PLSI 等技术,这里就不详细说明了。
感兴趣的话,可以下载整篇论文来读。
链接是:http://www2007.org/papers/paper570.pdf
呵呵,用 google news 的朋友们可以试试,也许这项新技术已经被用在 google news 中了呢~~~
相关阅读 更多 +