||
期刊:Data Science and Engineering
微信:点击阅读微信原文
文章介绍
POI 推荐已成为一种流行的基于位置的服务形式,受到学术界和工业界的关注。在移动场景中,用户偏好的多样性、可变性和时空上下文动态性等特征给POI推荐带来了巨大挑战:①如何准确捕捉移动环境中多样和易变的用户偏好?②基于模型的方法如何满足POI推荐系统对实时响应的需求?文章提出了一个融合框架JANICP,通过联合训练离线/近线用户内在偏好感知模型和在线用户上下文偏好预测模型,利用注意力聚合机制实现连续POI推荐。离线模型基于全局历史行为数据进行训练,以实现用户的稳定偏好表示;在线模型基于即时选择的上下文敏感数据进行训练,以实现用户的动态偏好感知;注意力聚合模块用于完全连接两种偏好表示,生成最终POI推荐。为提高模型的在线推荐性能,设计了一个基于改进IR-tree的POI索引结构,通过过滤POI候选集来加速模型响应速度。在真实数据集上进行了大量实验,结果表明提出的融合框架优于现有方法。论文的主要贡献如下:
(1) 提出了一个基于用户稳定偏好和上下文动态偏好联合训练的注意力模型,充分考虑了用户稳定偏好的持久性和即时偏好的动态性。
(2) 为全局POI设计了基于R树的索引结构,在聚合阶段用于生成候选集,以减少计算空间,提高模型的即时响应能力。
(3) 在三个真实数据集上进行了大量实验,以探究提出框架的有效性,实验结果表明,与基线模型相比,JANICP融合模型具有更高的性能。
实验效果
各方法在Precision@K、Recall@K方面的预测性能如表1和表2所示。表1展示了各方法在三个数据集上的precision@K比较,表2展示了各方法在三个数据集上的Recall@K比较。三个数据集NYC、TKY、Weeplaces的详细统计数据见表3。总的来说,模型在三个数据集中都比基线方法获得了更高的性能。
表1.各方法在Precision@N上的性能比较
在所有基线中,STRNN表现最差,因为RNN无法解决长期依赖的问题。FPMC性能不佳可能是因为它只捕捉顺序效应而忽略了时空影响。SHAN的性能优于STRNN、FPMC和SAE-NAD,它使用一个分层的注意力网络,结合了用户动态的长期和短期偏好。STAN和TiSASRec显著优于其他方法,这两种方法都考虑了时间间隔。只有JANICP充分考虑了用户的稳定偏好和上下文偏好,并充分考虑了POI类别、时间和地理影响。此外,六个基线没有考虑POI类别的影响,FPMC和SHAN没有考虑时间和空间关系的影响,这可能是性能略低于JANICP的原因。
表2.各方法在Recall@N上的性能比较
表3.三个数据集的数据统计
结语
论文提出了一个基于自注意力机制的融合模型,用于解决连续POI推荐中的复杂偏好捕获和在线响应问题。该模型结合了用户的稳定偏好和易变的上下文即时偏好。为了提高推荐的实时性能,通过离线训练用户的稳定偏好,使用R-树来过滤POI候选集,来加速模型响应速度。在三个真实数据集上进行了大量实验。实验结果表明,模型在精确率和召回率方面优于基线模型。
作者简介
钟海婷,女,1999年生,山东大学软件工程硕士研究生,CCF学生会员,研究方向为POI推荐系统。
何伟,男,山东大学副教授,硕士生导师,美国德克萨斯大学达拉斯分校访问学者,主要研究方向服务推荐、分布式计算、数据分析等,主持和参与国家科技支撑计划重点项目课题、国家自然科学基金、山东省科技发展计划、山东省优秀中青年科学家科研奖励基金等国家和省部级项目十余项,在《软件学报》、《中国科学》、IJCAI、ICSOC等国内外重要期刊会议发表论文30余篇,获得山东省科技进步奖2项。
崔立真,男,博士,山东大学教授,博士生导师,软件学院院长,山东大学-南洋理工大学人工智能国际联合研究院(C-FAIR)联合院长,泰山学者特聘专家,国家重点研发计划项目首席。主要研究方向为软件与数据工程,先后主持国家自然基金重点项目、国家重点研发计划等国家、省部级科研项目30余项。在TKDE、TPAMI、KDD、ICDE、AAAI等发表高水平学术论文100余篇。获省部级科技奖6项,国家教学成果奖一等奖和山东省教学成果特等奖3项。
刘磊,男,山东大学齐鲁青年学者特聘教授,博士生导师,国家重点研发计划项目负责人,人工智能专业负责人,CCF YOCSEF济南分论坛主席,主要研究方向为网络大数据分析与管理,在JSAC等国内外顶级会议和期刊发表论文60余篇。
闫中敏,女,山东大学副教授,硕士生导师,软件工程系主任,CCF信息系统专委会委员。主持和参与国家自然科学基金、国家科技支撑计划等国家和省部级项目十余项,在国内外重要期刊会议发表论文20余篇,多次获山东省科技进步奖。
期刊简介
Data Science and Engineering(DSE)是由中国计算机学会(CCF)主办、数据库专业委员会承办、施普林格 自然(Springer Nature)出版的Open Access期刊。为了迎合相关领域的快速发展需求,DSE致力于出版所有和数据科学与工程领域相关的关键科学问题与前沿研究热点,以大数据作为研究重点,征稿范畴主要包括4方面:(1)数据本身,(2)数据信息提取方法,(3)数据计算理论,和(4)用来分析与管理数据的技术和系统。
目前期刊已被EI、ESCI与SCOPUS收录,CiteScore 2021为6.4,在Computer Science Applications领域排名# 157/747(位列前21%)。稿件处理费由赞助商中新赛克(Sinovatio)承担,欢迎大家免费下载阅读期刊全文,并积极投稿。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-16 21:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社