第1章 搜索引擎简述.pptxVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档免费下载、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
SEO 教程:搜索引擎优化 基础实战入门(微课版);第1章 搜索引擎简述;学习目标 了解搜索引擎 掌握搜索引擎工作流程 掌握百度特效搜索 技能要点 掌握搜索引擎工作流程 如何吸引搜索引擎蜘蛛来抓取页面 掌握搜索引擎的抓取顺序 实训任务 模拟百度蜘蛛抓取页面提取文字 测试百度特效搜索 ;效果欣赏 ; 1.1 了解搜索引擎; 1.1.2 搜索引擎的种类 1.国内搜索引擎市场份额 如图 1-1 所示,图中为大家展示的是 2017 年 6 月国内主要搜索引擎的市场份额,其中: 百度国内市场份额为 80.50%,排名第一(即最大) ; 360 搜索排名第二,市场份额为 8.83%; 神马排名第三,市场份额为 4.82%; 搜狗搜索排名第四,市场份额为 2.50%; Google 排名第五,市场份额为 1.70%; 必应排名第六,市场份额为 1.11%;; 图1-1 中的大部分搜索引擎大家都应该有所了解,这里重点讲解一下神马搜索。神马搜索是手机端UC 浏览器默认的搜索引擎,是 UC(优视)公司和阿里巴巴集团在 2013 年成立合资公司推出的移动搜索引擎。 ;图 1-1 2017 年 6 月国内主要搜索引擎的市场份额; 2.全球搜索引擎市场份额 图1-2展示的是 2017 年 4 月全球主要搜索引擎的市场份额,其中: Google 全球市场份额从 92.34%上升至 92.5%(↑0.16%) ,排名第一(即最大) ; Bing 排名第二,市场份额从 2.93%下降至 2.87%;(↓0.06%) Yahoo!排名第三,市场份额从 2.20%下降至 2.01%;(↓0.19%) 百度排名第四,市场份额从 1.05%上升至 1.11%;(↑0.06%) Yandex 排名第五,市场份额从 0.73%下降至 0.71%。(↓0.02%) ;图 1-2 2017 年 4 月全球主要搜索引擎的市场份额;1.2 搜索引擎工作流程; 百度的抓取程序我们一般称为百度蜘蛛,常见的有 Baiduspider、Baiduspider-mobile(抓取 wap) Baiduspider-image(抓取图片)Baiduspider-video(抓取视频)Baiduspider-news(抓取新闻) 。 谷歌的抓取程序我们一般称为谷歌机器人,常见的有 Googlebot、Googlebot-Mobile(抓取 wap) 。 360 的抓取程序我们一般称为 360 蜘蛛,常见的只有一个:360Spider。; 蜘蛛访问任何一个站点的时候都会访问网站根目录中的 robots.txt 文件。这个文件限制了搜索引擎蜘蛛的抓取范??,所有的蜘蛛都必须遵守这个文件中的协议。另外,我们可以从一些站点中的 robots.txt文件中查看搜索引擎蜘蛛的最新名称。 ; 2.跟踪链接(蜘蛛抓取顺序) 为了抓取互联网中更多的页面,搜索引擎会根据网页中的链接从一个页面抓向另一个页面,就像蜘蛛在蜘蛛网上爬行一样,这也就是搜索引擎蜘蛛这个名字的由来。 ; 如图 1-3 所示,蜘蛛顺着一个 A 页面爬行到 A1、A2、A3、A4,直到页面没有链接之后就会返回 A页面,然后爬行到另外一个页面;同样按照 B1、B2、B3、B4 的顺序抓取,有点类似于不撞南墙不回头的样子。这就是我们说的深度优先策略。; 如图 1-4 所示,蜘蛛从 A 页面开始顺着链接爬行到 A1、B1、C1 页面,直到 A 页面上的链接都爬完之后,再从 A1 页面开始抓取下一层的链接页面,分别爬行到 A2、A3、A4……这就是我们说的广度优先策略。 ; 在实际应用中,两种策略通常是互相混合使用的,这样可以抓取到互联网中更多的页面,特别是网站中内页深度比较深的一些页面。 ;3.如何吸引蜘蛛来抓取网站中的页面 (1)权重越高、蜘蛛来得越频繁; (2)更新越快,蜘蛛来得越频繁; (3)导入链接越多,蜘蛛来得越频繁; (4)与首页点击距离越小,蜘蛛收录得越快。 ; 网站建立初期,搜索引擎有可能是不知道咱们站点的,我们需要通过以下两个方法来告诉搜索引擎。 (1)加入百度站长平台,提交网址链接并在网站布置自动推送代码(见图 1-5) 。 (2)外部链接:我们可以在一些已经被收录的站点中放置我们自己的站点链接以此来吸引蜘蛛访问, 可以发布软文也可以交换友情链接。 ;图 1-5 百度站长平台提交网址链接;4.如何查看蜘蛛是否访问过站点 (1)百度站长平台蜘蛛抓取频次工具(见图 1-6) 。 工具地址:/pressure/index ;图 1-6 百度站长平台蜘蛛抓取频次工具; (2)服务器日志。 如果你的服务器开启了日志功能,通过网站日志可以清楚地得知用户在什么 I

您可能关注的文档

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档免费下

相关文档

相关课程推荐