- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
消费者运营分析
11.4.1评价词频分析&11.4.2评价情感分析
评价词频分析
CONTENTS
评价情感分析
评价词频分析
PART ONE
评价词频分析
词频分析是文本分析的基础,基于词频可以了解大量文本信息的内容,既可以分析自己的商品也可以分析竞品。
接口说明如下。
通过基于机器学习算法分词的开源接口,可查阅接口的相关说明。
接口:/get.php?source= ¶m1=¶m2=。
接口参数如下。
“Source=”:要分词的文本。
“Param1=”:返回分词结果的概率,最小为0,最大为1。
“Param2=”:是否为调试模式,调试模式可以看到分词结果的概率。0为非调试模式,1为调试模式。
例1:/get.php?source=清华大学是好学校¶m1=0¶m2=1。
返回:清华:0.604942 清华大学:1 华大:0.068537 大学:0.937618 好学:0.730473 好学校:0.699564 学校:0.833307
例2:/get.php?source=清华大学是好学校¶m1=0.8¶m2=1。
返回:清华大学:1 大学:0.949906 学校:0.936925
例3:/get.php?source=清华大学是好学校¶m1=0¶m2=0
返回:清华 清华大学 华大 大学 好学 学校
评价词频分析
图1
评价词频分析
例4:图1所示为采集某竞品的消费者评价数据,分析评价的词频。
数据采集路径:【淘宝商品】-【评价详情页】。
解:选中数据,如图2所示,在【数据】选项卡中单击【自表格/区域】选项,将评价导入Power Query编辑器。
图2
图3
图4
如图3所示,在Power Query编辑器中筛选数据,搜索“此用户”,将无效的评价“此用户没有填写评价。”过滤掉。
如图4所示,在【添加列】选项卡中,单击【自定义列】功能键。
评价词频分析
图5
图6
评价词频分析
如图5所示,键入公式“
Csv.Document(Web.Contents
("/get.php?source="&Uri.EscapeDataString
([评价]) &"¶m1=0.8¶m2=0"))”。
M函数说明:
Web.Contents:是以二进制文件的格式下载网页。
Csv.Document:是将二进制文件转换成Csv格式的表格。
由于是访问互联网数据需要设置隐私级别,为了方便练习,如图6所示,可直接勾选【忽略此文件的隐私级别检查……】,老版本没有这个选项,选择公共权限。
获取数据后,如图7所示,勾选【展开】和【Column1】字段,展开后将字段“Column1”重命名为“分词”。
图7
图8
消费者复购率计算与分析
展开后,按照图8所示内容,筛选掉空白行。
图9
图10
消费者复购率计算与分析
如图9所示,在【开始】选项卡中单击【分组依据】选项。
如图10所示,基于分词进行分组。
图11
图12
消费者复购率计算与分析
如图11所示,单击【开始】选项卡中【关闭并上载】选项,将数据关闭并上载到Excel工作表中。
如图12所示,对“计数”进行排序,可以观察到买家对这款产品的评价关键词,通过观察可以发现买家对这款产品满意的占比较大,因此这款产品的效果不错。
评价情感分析
PART TWO
评价情感分析
评价情感分析是判断文本的情感得分,正面得分越高表示买家对产品或服务越满意,负面得分越高表示消费者对产品或服务越不满意。
商业接口可以在API集市申请,本例使用/的接口,每天可调用500次。
接口地址:/sentiment/analysis。
调用方式:Post。
图13
图14
例5:图13所示是评价数据,使用接口分析评价情感得分。数据采集路径:【淘宝商品】-【评价详情页】。
选中数据,如图14所示,在【数据】选项卡中单击【自表格/区域】选项,将评价导入Power Query编辑器。
评价情感分析
图15
图16
由于接口的次数限制,在Power Query编辑器中进行数据筛选,只保留前5条,每次只消耗5次API调用次数。如图15所示,在Power Query编辑器【开始】选项卡中,单击【保留行】中的【保留最前面几行】选项,指定保留5行。
如图16所示,在【添加列】选项卡中,单击【自定义列】选项。
评价情感分析
如图17所示,键入函数:“Json.Document(Web.Contents("/sentiment/
analysis",[Headers=[#"X-Token"="UGlLtDcd.16189.
文档评论(0)