||
个性化推荐系统的研究进展
什么是个性化推荐?
推荐问题从根本上说,就是代替用户评估他从未看过的产品,是一个从已知到未知的过程。个性化的含义是指针对用户的个人喜好,“有的放矢”的推荐产品。
一个完整的推荐系统由3部分构成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块。其中,推荐算法模块是推荐系统中最为核心的部分。
根据推荐算法的不同,推荐系统可以分为以下几类:协同过滤(collaborative filtering)系统;基于内容(content-based)的推荐系统;混合(hybrid)推荐系统以及最近兴起的基于用户—产品二部图网络结构(network-based)的推荐系统。
1、协同过滤系统
协同过滤的思想借鉴了日常在选购商品、选择用餐饭店、选择看那部电影等等的方法:如果自己身边很多朋友都选购某种商品,那么自己就会很大概率的选择该商品。其核心思想分为两步:首先是利用用户的历史信息计算用户之间的相似性;然后利用与目标用户相似性较高的邻居对其他产品的评价来预测目标用户对特定产品的喜好程度。
协同过滤推荐系统算法可以分为两类:基于记忆(memory-based)的和基于模型(model-based)的算法。
基于记忆的算法根据系统中所有被打过分数产品信息进行预测。一个新用户对某个产品的打分,与其相似用户对该产品的打分是近似的。该算法的核心部分是如何计算用户间的相似度,以及如何整合相似用户对该产品的评分。计算用户相似度的算法常用有两种:Pearson相关性和余弦相似度。
基于模型的算法收集打分数据进行学习并推断用户行为模型,进而对某个产品进行预测打分。基于模型的协同过滤算法和基于记忆的算法的不同在于,基于模型的算法不是基于一些启发规则进行预测计算,而是基于对已有数据应用统计和机器学习得到的模型进行预测。
2、基于内容的推荐系统
最初的基于内容的推荐系统(content-basedrecommendation)是协同过滤技术的延伸与发展,他不需要依据用户对项目的评价意见,而是依据用户已经选择的产品内容信息计算用户之间的相似度,进而进行相应的推荐。在信息获取中,表征文本的最常用方法就是TF-IDF方法。还有其他如Bayes分类、聚类分析、决策树、人工神经网络等。
基于内容的推荐系统中,用户的配置文件构建与更新是其中最为核心的部分之一,也是目前研究人员关注的焦点。
3、基于网络结构的推荐算法
基于网络结构的推荐算法不考虑用户和产品的内容特征,而仅仅把它们看成抽象的结点,所有算法利用的信息都藏在用户和产品的选择关系之中。这种算法适合与新兴的社交网络研究。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 20:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社