基于地理标记照片的个性化景点推荐方法.docx

基于地理标记照片的个性化景点推荐方法.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于地理标记照片的个性化景点推荐方法 摘要:研究如何根据已有的海量旅游信息及数据,为游客个性化推荐旅游景点具有重要意义。本文利用从Flickr网站获取的2013—2018年香港特别行政区范围内的地理标记照片来识别旅游景点,并根据游客游览顺序重建旅游轨迹。在此基础上,针对现有方法尚未考虑游客偏好在旅行过程中会发生动态变化的问题,提出一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Long and Short-Term Preference,L-ULSP)。该方法利用LDA主题模型获取景点特征信息,挖掘景点间的相关性,再利用注意力机制和长短期记忆网络分别学习用户的长期偏好和短期偏好,最后结合长短期偏好捕捉用户偏好的动态变化。实验结果表明,L-ULSP方法所推荐的景点在命中率和平均倒数排名2个指标上均优于现有其他方法,证明了本文所提方法可以从景点序列中有效学习游客偏好,并为游客推荐下一个景点。此外,本文通过对比实验,进一步验证了同时考虑用户的长短期偏好能够更好地学习用户的偏好变化。 1 引言 得益于定位技术的发展,地理位置信息已普遍存在于社交网络服务中。例如,Flickr自2004年创立到2018年1月,数据库已累计存储64.7亿张照片,这些照片通常包含地理位置、拍摄时间及标签文本等信息,可用于重建游客的移动轨迹、分析不同游客的旅行模式 近年来,循环神经网络(Recurrent Neural Network,RNN) 鉴于以上分析,针对当前的景点推荐方法忽略了景点之间的相关性,及未充分考虑用户偏好的动态变化的问题,本文提出一种基于LDA主题模型和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Longterm and Short-term Preference,L-ULSP)。该方法利用LDA主题模型获取游客旅行的主题分布,挖掘景点特征信息;引入注意力机制考虑不同景点的重要程度,关注历史序列中重要的景点信息捕捉用户长期偏好,利用LSTM为用户序列建模学习用户短期偏好,将长期偏好与短期偏好进行加权得到最终偏好,以预测游客下一次可能访问的景点。L-UL-SP不存在独立假设性问题并减少了数据的稀疏性带来的影响,为景点序列信息建模的同时,动态捕捉游客长短期偏好,实现高效推荐旅游景点。 2 数据来源与研究方法 本文提出的基于地理标记照片的个性化景点推荐方法包括数据准备和处理、个性化景点推荐2个部分,该方法的框架如图1所示。 2.1 数据准备和处理 2.1.1 地理标记照片处理 本文将典型的旅游城市——香港特别行政区作为研究区域,通过Flickr API(/services/api/)获取2013年1月至2018年12月香港特别行政区范围内具有地理标记信息的照片及属性信息(用户名、照片ID、拍摄时间、经纬度以及文本标签),共得到9524位用户的315 598条记录(照片及其属性信息)。但这些记录不能直接使用,必须进行清洗:(1)删除地理位置位于香港特别行政区之外的记录;(2)结合照片的用户名、经纬度以及拍摄时间对重复数据仅保留一条;(3)利用基于熵的方法 2.1.2 旅游热点区域识别 重建游客旅游轨迹,首先需要识别城市的旅游热点区域。热点区域的判断通常有2种:(1)根据照片密度;(2)根据游客密度。在国内外相关的研究中,常用的密度聚类算法(如DBSCAN算法、Meanshift算法)使用照片密度为阈值识别热点区域,而P-DBSCAN算法 式中:δ表示邻域半径;Owner(p)表示照片p的所有者(上传照片p的游客)。若照片p和q所属游客不同,且距离不大于θ,则称照片q是照片p的邻域照片。邻域照片集N 2.2 个性化景点推荐模型 2.2.1 模型及相关定义 本文个性化景点推荐模型的结构如图2所示,符号定义如表1所示,其基本思想是通过联合学习长期和短期偏好,计算每个景点游客下一次访问景点的概率并生成推荐列表。地理标记照片的文本标签是用户上传照片对景点的描述,可应用主题模型来发现隐含的主题信息,这些主题代表了景点的特征和用户的偏好。本文利用概率主题建模技术LDA挖掘景点的主题特征,挖掘景点之间的相关性。L-ULSP模型将每个游客的景点序列及景点对应的主题特征信息作为初始输入,通过注意力机制关注长期序列中的重要信息,捕捉游客的长期偏好,利用LSTM为短期序列进行序列化信息建模,学习游客的短期偏好。最后,将长短期偏好进行加权得到游客的最终偏好,计算并输出每个景点在

您可能关注的文档

文档评论(0)

lmzwkyc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档