- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广西大学数学与信息科学学院
商务智能课程论文
题目:商务智能在大众点评中的应用
小组成员:1111200139 蓝承妙
1111200202 刘金香
摘要:大众点评是中国率先的本地生活信息及交易平台,也是全球最早建立的独立第三方 消费点评网站,它不仅为网友提供商户信息、消费点评及消费优惠等信息服务,同时亦提 供团购及餐厅预订等020 (Online To Offline)交易服务。本文通过分类回归树和关联规则 挖掘出大众点评数据中关于全国各地美食商家的可用信息。
关键字:大众点评分类回归树关联规则SPSS
=匕豆.
、冃示
随着互联网的浮现与飞速发展,人们的生活方式向来在发生着巨大的变化。特殊是交 通、购物、饮食、住宿、教育等各方面均受到来自互联网的极大的影响。大众点评便是一 个影响人们日常生活,方便人们娱乐、饮食的点评网站。大众点评是中国率先的本地生活 信息及交易平台,也是全球最早建立的独立第三方消费点评网站。大众点评不仅为网友提 供商户信息、消费点评及消费优惠等信息服务,同时亦提供团购、电子会员卡及餐厅预订 等020(Online To Offline)交易服务。大众点评是国内最早开辟本地生活挪移应用的企业, 已经成长为一家挪移互联网公司,大众点评挪移客户端已成为本地生活必备工具。
本文使用的数据为大众点评网在2022年4月份更新后的商家数据,其中包含全国各 地区1000家美食店相关数据,包括商户ID(shop_id)、商户名称(name)、所处省份(province)、 城市(city)、区(area)、具体地址(address)、联系电话(phone)、营业时间(hours)、平均物价 (avg_price)、会员卡服务、大众对其产品的各类评价等级、环境、服务等级等数据项。
为了有效的使用该数据,本文运用分类回归树、关联规则两种数据挖掘方法对该数据 进行分析。
二、分类回归树(C&RT)
2.1 C&R tree
分类回归树(C&R tree,全称为 the classification and regression tree)是- -种基于树的分类 和预测方法,模型使用简单,易于理解(规则解释起来更简明易),该方法通过在每一个步 骤最大限度降低不清纯度,使用递归分区来将训练记录分割为组。
2.2目的
通过分析数据中存在的预测因子变量,如店铺的环境等级、产品等级和服务等级等预 测并分类,为新用户在选择是否光顾某家店铺提供决策依据。
2.3数据整理
原始数据中包含的内容多而繁杂,为了方便研究,我们从中筛选了涉及店家评价的数 据项 avg_price、product_rating、environment_rating、service_rating、very_good_remarks、 good_remarks、common_remarks、bad_remarks、very_bad_remarks 进行整理, 将 very_good_remarks、good_remarks、common_remarks 这三个字段处理为积极评价,字段 jiji
的值为这三个字段的总和,视为对该店家的积极评价,将bad_remarks、very_bad_remarks 这二个字段处理为消极评价,字段xiaoji的值为这二个字段的总和,为该店家的消极评价。 新增字段hh取值为0和1,判定该店铺是否值得新客户选择,如果该店铺消极评价(xiaoji) 的值小于总评价(jiji+xiaoji)的10%,则认为该店铺值得选择,hh的值为1;反之,则为 0,该店铺不值得选择。
整理后的数据:avg_price、product_rating、environment_rating、service_rating、hh。
2.4创建决策树
将整理后的数据添加到SPSS工作区域,再添加一个类型节点。在类型节点中,选择
Read Value来为指定的字段读取数据。选择hh字段,将其type设为Flag, Direction设为 Out,如图1所示。其余所有字段都作为预测因子变量,将Direction设为In。
图1在类型节点中设置相关参数
在类型节点上连接一个C&RT节点,设置其参数,选择简单模式(Simple Mode),如图2所示。
图2 Simple标签
运行C&RT节点,浮现交互式窗口,彻底展开的决策树如图3所示。
节点1类别 % ri0.000 30.700
节点1
类别 % ri
0.000 30.700 272
. 1.CIM 59.3W 引 4
总计 88.600 886
environment_rating
节点2
类别 % n
0J00 3.509 4
■ 1一0叩 北.4
您可能关注的文档
- 大学四年考证规划.docx
- 大学劳动节活动策划.docx
- 大学军训心得体会2022字范文大学军训心得优秀作文.docx
- 大学作业财务分析1.docx
- 大学中庸读后感800.docx
- 大型设备运输安全技术措施.docx
- 大型建筑工程项目风险防范问题探析论文(1).docx
- 大型厂房设计防火规范强制性条文依据标准和规范条款.docx
- 大型公路桥梁钢箱梁制造与验收规范.docx
- 大型中医医院巡查细则(2022版).docx
- 2024年PCB锣板机行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年PU脱模剂行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年PGA(聚乙醇酸)行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年K12在线直播行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年IPTV运营行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年PCB钢网清洗机行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年OTA交通票务行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年pp树脂行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年PM2.5监测行业分析报告及未来五到十年行业发展趋势报告.docx
- 2024年GPS报站器行业分析报告及未来五到十年行业发展趋势报告.docx
文档评论(0)