- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于地理标记照片的个性化景点推荐方法
摘要:研究如何根据已有的海量旅游信息及数据,为游客个性化推荐旅游景点具有重要意义。本文利用从Flickr网站获取的2013—2018年香港特别行政区范围内的地理标记照片来识别旅游景点,并根据游客游览顺序重建旅游轨迹。在此基础上,针对现有方法尚未考虑游客偏好在旅行过程中会发生动态变化的问题,提出一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Long and Short-Term Preference,L-ULSP)。该方法利用LDA主题模型获取景点特征信息,挖掘景点间的相关性,再利用注意力机制和长短期记忆网络分别学习用户的长期偏好和短期偏好,最后结合长短期偏好捕捉用户偏好的动态变化。实验结果表明,L-ULSP方法所推荐的景点在命中率和平均倒数排名2个指标上均优于现有其他方法,证明了本文所提方法可以从景点序列中有效学习游客偏好,并为游客推荐下一个景点。此外,本文通过对比实验,进一步验证了同时考虑用户的长短期偏好能够更好地学习用户的偏好变化。
1 引言得益于定位技术的发展,地理位置信息已普遍存在于社交网络服务中。例如,Flickr自2004年创立到2018年1月,数据库已累计存储64.7亿张照片,这些照片通常包含地理位置、拍摄时间及标签文本等信息,可用于重建游客的移动轨迹、分析不同游客的旅行模式近年来,循环神经网络(Recurrent Neural Network,RNN)鉴于以上分析,针对当前的景点推荐方法忽略了景点之间的相关性,及未充分考虑用户偏好的动态变化的问题,本文提出一种基于LDA主题模型和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Longterm and Short-term Preference,L-ULSP)。该方法利用LDA主题模型获取游客旅行的主题分布,挖掘景点特征信息;引入注意力机制考虑不同景点的重要程度,关注历史序列中重要的景点信息捕捉用户长期偏好,利用LSTM为用户序列建模学习用户短期偏好,将长期偏好与短期偏好进行加权得到最终偏好,以预测游客下一次可能访问的景点。L-UL-SP不存在独立假设性问题并减少了数据的稀疏性带来的影响,为景点序列信息建模的同时,动态捕捉游客长短期偏好,实现高效推荐旅游景点。2 数据来源与研究方法本文提出的基于地理标记照片的个性化景点推荐方法包括数据准备和处理、个性化景点推荐2个部分,该方法的框架如图1所示。2.1 数据准备和处理2.1.1 地理标记照片处理本文将典型的旅游城市——香港特别行政区作为研究区域,通过Flickr API(/services/api/)获取2013年1月至2018年12月香港特别行政区范围内具有地理标记信息的照片及属性信息(用户名、照片ID、拍摄时间、经纬度以及文本标签),共得到9524位用户的315 598条记录(照片及其属性信息)。但这些记录不能直接使用,必须进行清洗:(1)删除地理位置位于香港特别行政区之外的记录;(2)结合照片的用户名、经纬度以及拍摄时间对重复数据仅保留一条;(3)利用基于熵的方法2.1.2 旅游热点区域识别重建游客旅游轨迹,首先需要识别城市的旅游热点区域。热点区域的判断通常有2种:(1)根据照片密度;(2)根据游客密度。在国内外相关的研究中,常用的密度聚类算法(如DBSCAN算法、Meanshift算法)使用照片密度为阈值识别热点区域,而P-DBSCAN算法式中:δ表示邻域半径;Owner(p)表示照片p的所有者(上传照片p的游客)。若照片p和q所属游客不同,且距离不大于θ,则称照片q是照片p的邻域照片。邻域照片集N2.2 个性化景点推荐模型2.2.1 模型及相关定义本文个性化景点推荐模型的结构如图2所示,符号定义如表1所示,其基本思想是通过联合学习长期和短期偏好,计算每个景点游客下一次访问景点的概率并生成推荐列表。地理标记照片的文本标签是用户上传照片对景点的描述,可应用主题模型来发现隐含的主题信息,这些主题代表了景点的特征和用户的偏好。本文利用概率主题建模技术LDA挖掘景点的主题特征,挖掘景点之间的相关性。L-ULSP模型将每个游客的景点序列及景点对应的主题特征信息作为初始输入,通过注意力机制关注长期序列中的重要信息,捕捉游客的长期偏好,利用LSTM为短期序列进行序列化信息建模,学习游客的短期偏好。最后,将长短期偏好进行加权得到游客的最终偏好,计算并输出每个景点在
您可能关注的文档
- 百万扩招背景下我国高等职业教育办学经费问题探析.docx
- 大数据背景下高校信息管理类人才胜任力素质模型构建.docx
- 党员干部培训中现场教学的优势和作用.docx
- 电工技术课程的教学实践分析.docx
- 多媒体微课在教学案例中的实践.docx
- 多媒体与小学语文的整合.docx
- 非典型性乡村关键性建筑改造的实践与思考.docx
- 改进遗传算法优化的矿车驱动系统自抗扰控制.docx
- 高考化学实验试题分析与复习策略研究.docx
- 高校多媒体教室的有效管理研究.docx
- 第六单元名著导读《钢铁是怎样炼成的》导学导练课件-2023-2024学年统编版语文八年级下册.pptx
- 第十二单元核心素养测评课件-2023-2024学年九年级化学人教版下册.pptx
- 电流与电压和电阻的关系说课(1) --2023-2024学年人教版 九年级物理上学期.pptx
- 第4单元 世界音乐之窗——拉丁美洲音乐 《玛丽安》 课件 2023—2024学年粤教版初中音乐八年级下册 -.pptx
- 第12课 智能预测出行方式 课件 -2023-—2024学年浙教版(2023)初中信息技术九年级全册 .pptx
- 鲁教版初中信息科技《计数循环我在行 》课件.pptx
- 复习-Python初中信息技术.pptx
- 山西省大同市2023-2024学年八年级下学期期中语文试题(含解析).pdf
- 2024届四川省成都市实验外国语学校高三下学期三模物理试题(含答案).pdf
- 2024年广东省广州市第六中学中考一模语文试题(解析版).pdf
1亿VIP精品文档
相关文档
最近下载
- 一年级下册古诗试题 -“诗词大会”题库一(有答案) 人教部编版.pdf
- 山东省高考化学模拟测试卷(附带答案解析).pdf VIP
- 混凝沉淀烧杯试验方法.pdf
- 2023年上海市奉贤区中考物理二模试卷(附答案详解).docx VIP
- 广西壮族自治区南宁三中、柳州高中2023-2024学年高三上学期第一次适应性考试化学试题和答案详解.pdf
- 初二数学压轴题100题.docx VIP
- 2023-2024学年湖北省咸宁咸安区六校联考中考联考历史试卷含解析.doc VIP
- 抖音小店运营教学.pptx VIP
- 2024年潍坊市高三二模(高考模拟考试二)数学试卷(含官方答案).pdf
- 人教版PEP四年级下册英语《第四单元Unit 4》教学设计公开课教案.pdf
文档评论(0)