互联网智能推荐系统架构设计.docxVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
互联网智能推荐系统架构设计 PAGE 13 互联网智能推荐系统架构设计全文共21页,当前为第1页。 互联网智能推荐系统架构设计全文共21页,当前为第1页。 互联网智能推荐系统架构设计 互联网智能推荐系统架构设计全文共21页,当前为第2页。一,题记 互联网智能推荐系统架构设计全文共21页,当前为第2页。 58同城智能推荐系统大约诞生于2014年(C++实现),该套系统先后经历了招聘、房产、二手车、黄页和二手物品等产品线的推荐业务迭代,但该系统耦合性高,难以适应推荐策略的快速迭代。 58同城APP猜你喜欢推荐和推送项目在2016年快速迭代,产出了一套基于微服务架构的推荐系统(Java实现),该系统稳定、高性能且耦合性低,支持推荐策略的快速迭代,大大提高了推荐业务的迭代效率。 此后,我们对旧的推荐系统进行了重构,将所有业务接入至新的推荐系统,最终成功打造了统一的58同城智能推荐系统。 下面我们将对58同城智能推荐系统展开介绍,首先会概览整体架构,然后从算法、系统和数据三方面做详细介绍。 整体架构首先看一下58同城推荐系统整体架构,一共分数据层、策略层和应用层三层,基于58平台产生的各类业务数据和用户积累的丰富的行为数据,我们采用各类策略对数据进行挖掘分析,最终将结果应用于各类推荐场景。 互联网智能推荐系统架构设计全文共21页,当前为第3页。 互联网智能推荐系统架构设计全文共21页,当前为第3页。 二,数据层 主要包括业务数据和用户行为日志数据。业务数据主要包含用户数据和帖子数据,用户数据即58平台上注册用户的基础数据,这里包括C端用户和企业用户的信息,帖子数据即用户在58平台上发布的帖子的基础属性数据。 这里的帖子是指用户发布的房源、车源、职位、黄页等信息,为方便表达,后文将这些信息统称为帖子。用户行为日志数据来源于在前端和后台的埋点,例如用户在APP上的筛选、点击、收藏、打电话、微聊等各类操作日志。 互联网智能推荐系统架构设计全文共21页,当前为第4页。这些数据都存在两种存储方式,一种是批量存储在HDFS上以用作离线分析,一种是实时流向Kafka以用作实时计算。 互联网智能推荐系统架构设计全文共21页,当前为第4页。 三,策略层 基于离线和实时数据,首先会开展各类基础数据计算,例如用户画像、帖子画像和各类数据分析,在这些基础数据之上便是推荐系统中最重要的两个环节:召回和排序。召回环节包括多种召回源的计算,例如热门召回、用户兴趣召回、关联规则、协同过滤、矩阵分解和DNN等。 我们采用机器学习模型来做推荐排序,先后迭代了LR、FM、GBDT、融合模型以及DNN,基于这些基础机器学习模型,我们开展了点击率、转化率和停留时长多指标的排序。 这一层的数据处理使用了多种计算工具,例如使用MapReduce和Hive做离线计算,使用Kylin做多维数据分析,使用Spark、DMLC做大规模分布式机器学习模型训练,使用theano和tensorflow做深度模型训练。 三,应用层 再往上就是应用层,我们通过对外提供rpc和http接口来实现推荐业务的接入。58同城的推荐应用大多是向用户展示一个推荐结果列表,属于topN推荐模式,这里介绍下58同城的几个重要的推荐产品: 互联网智能推荐系统架构设计全文共21页,当前为第5页。猜你喜欢:58同城最重要的推荐产品,推荐场景包括APP首页和不同品类的大类页,目标是让用户打开APP或进入大类页时可以快速找到他们想要的帖子信息,这主要根据用户的个人偏好进行推荐。 互联网智能推荐系统架构设计全文共21页,当前为第5页。 详情页相关推荐:用户进入帖子详情页,会向用户推荐与当前帖子相关的帖子。该场景下用户意图较明显,会采用以当前帖子信息为主用户偏好信息为辅的方式进行推荐。 搜索少无结果推荐:用户会通过品类列表页上的筛选项或搜索框进入品类列表页获取信息,若当前筛选项或搜索条件搜索出的结果较少或者没有结果,便会触发推荐逻辑进行信息推荐。此时会结合当前搜索条件的扩展以及用户偏好信息进行推荐。 个性化推送(Push):在用户打开APP前,将用户感兴趣的信息推送给他们,促使用户点击,提高用户活跃度。这里包含推送通知的生成和推送落地页上帖子列表的生成两个推荐逻辑。值得一提的是推送是强制性的推荐,会对用户形成骚扰,因此如何降低用户骚扰并给用户推荐真正感兴趣的信息尤为重要。 Feed流推荐:我们的推荐产品在某些推荐场景下是以Feed流的形式展现的,例如APP消息中心的今日推荐场景、推送落地页场景。用户可以在这些页面中不断下拉刷新消费信息,类似时下火热的各大资讯Feed流推荐。 推荐系统是一个复杂的工程,涉及算法策略、工程架构和效果数据评估三方面的技术,后文将分别从这三方面介绍58同城推荐系统。 互联网智能推荐系统架构

文档评论(0)

孙二娘 + 关注
实名认证
文档贡献者

专注文档领域

认证主体陈**

1亿VIP精品文档

相关文档

相关课程推荐