爬虫技术-Requests模块.pptxVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
requests模块requests模块本节要点实验内容:实验目标:requests安装requests库的使用代理的设置与使用处理不信任的SSL证书能够掌握requests库的使用CONTENTSrequests安装1.requests库的使用2.代理的设置与使用3.处理不信任的SSL证书4.requests模块requests介绍requests是Kenneth Reitz编写的优雅、易用的HTTP库。requests的底层基于Python官方库urllib, requets良好的API设计使用更简洁方便。requests最核心的两个类:request:对HTTP请求的封装reponse:对HTTP返回结果的封装requests模块requests安装使用pip方法可以非常快速进行安装:requests学习文档:requests模块requests库的使用相较于urllib.request发送请求,requests库发送请求更加方便。常用的请求方式主要有GET和POST请求。这里可以直接使用requests.get()函数发送请求:添加headers和查询参数:想添加 headers,可以传入headers参数来增加请求头中的headers信息。要将参数放在url中传递,可以利用 params 参数。 requests模块requests库的使用相关示例代码如右图所示: requests模块requests库的使用"/s中的 s 相当于调用搜索模块;params 接收一个字典或者字符串的查询参数,字典类型自动转换为url编码,不需要使用urlencode();headers为设置的请求头,User-Agent则是浏览器的用户代理字符串。requests模块requests库的使用使用requests.post()函数发送post请求:传入data数据: 不使用urlencode进行编码,传入一个字典进去。 请求测试网站的数据的示例代码: requests模块requests库的使用requests模块代理的设置与使用很多网站会检测某一段时间某个IP的访问次数(通过流量统计,系统日志等),如果访问次数多的不像正常人,会禁止这个IP的访问。可以设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,可以换个IP继续爬取。requests模块代理的设置与使用爬虫程序目标服务器代理服务器requests模块代理的设置与使用通过访问网址/ip,获得自己的ip地址:注:代理ip地址可以去常用的代理网站中去选取。 requests模块处理不信任的SSL证书已经被信任的SSL整数的网站,比如/,使用requests以正常的返回响应。示例代码如下:requests设置移除SSL认证,控制台会抛出以下警告,但警告并不影响结果运行,可以去除爬虫的网站证书过期,可以在请求中加入verify=False。感谢您的观看

文档评论(0)

PPT制作,视频宣传片,动画模板

1亿VIP精品文档

相关文档