|||
大赛网址:http://openresearch.baidu.com/topic/40.jspx
算法数据集来自百度的电影数据库,以RMSE作为算法评价标准
数据库基本信息:用户数:9722,电影数:7889
算法 | 算法描述 | RMSE | 提交时间 |
RFREC | 基于频率乘积最大的预测 | 0.7443 | 2013-03-26 |
ITEM_AVG | 电影平均评分预测 | 0.7127 | 2013-03-26 |
ITEM_BASED_PEA | 基于Perason相似性的ItemBased协同过滤算法,最近邻个数K=100,找邻居时尽可能找到K个邻居来加权,且采用直接加权方式 | 0.8094 | 2013-04-01 |
ITEM_BASED_PEA | K=40,同上 | 0.8118 | 2013-04-01 |
ITEM_BASED_PEA | K=100,对评分差值加权,其他同上 | 0.7143 | 2013-04-01 |
ITEM_BASED_PEA | K=200,同上 | 0.7142 | 2013-04-01 |
ITEM_BASED_PEA | K=100,先找K个最近邻,再从中找评过的进行加权,加权方式是对评分的差值进行加权 | 0.7610 | 2013-04-01 |
USER_BASED_PEA | 基于Perason相似性的UserBased协同过滤算法,最近邻个数K=100,找邻居时尽可能找到K个邻居来加权,且采用直接加权方式 | 0.7005 | 2013-04-01 |
USER_BASED_PEA | K=400,同上 | 0.7001 | 2013-04-01 |
USER_BASED_PEA | K=1000,同上 | 0.7001 | 2013-04-01 |
USER_BASED_PEA | K=400,尽可能找K个邻居加权,对评分差值加权,不能预测的用Item平均评分代替 | 0.6994 | 2013-04-01 |
USER_BASED_LR | 线性回归预测算法(由我的好友谢峰提出,暂不公开) | 0.6897 | 2013-04-01 |
ITEM_BASED_LR | 线性回归预测 | 0.6854 | 2013-04-01 |
SLOPE_ONE | 加权的SlopeOne算法 | 0.6506 | 2013-04-01 |
SLOPE_ONE | 不加劝的Slope 算法 | 0.6522 | 2013-04-01 |
总得来说,加权的SlopeOne算法表现最好,当然,离上榜还有一定差距,目前排名前30的选手中,最好成绩为0.601,最差的也是0.6207,还需要再接再厉呀~
PS:目前的预测都是基于评分数据进行预测的,还没有利用用户的社交关系,电影标签等外部数据,相信后面在引入这些数据之后,效果会更好!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-28 00:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社