- 1、本文档共97页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目11 网络爬虫入门与应用11.1 了解HTML与JavaScript如果只是编写爬虫程序的话,毕竟不是开发网站,只需要能够看懂HTML代码基本上就可以了,不要求能编写。当然,对于一些高级爬虫和特殊的网站,还需要具有深厚的JavaScript功底,甚至JQuery、AJAX等知识。11.1.1 HTML基础(1)h标签在HTML代码中,使用h1到h6表示不同级别的标题,其中h1级别的标题字体最大,h6级别的标题字体最小。该标签的用法为:<h1>一级标题</h1><h2>二级标题</h2><h3>三级标题</h3>11.1.1 HTML基础(2)p标签在HTML代码中,p标签表示段落,用法为:<p>这是一个段落</p>11.1.1 HTML基础(3)a标签在HTML代码中,a标签表示超链接,使用时需要指定链接地址(由href属性来指定)和在页面上显示的文本,用法为:<a href="">点这里</a>11.1.1 HTML基础(4)img标签在HTML代码中,img标签用来显示一个图像,并使用src属性指定图像文件地址,可以使用本地文件,也可以指定网络上的图片。例如:<img src="Python可以这样学.jpg" width="200" height="300" /><img src="/upload/bigbookimg/072406-01.jpg" width="200" height="300" />11.1.1 HTML基础(5)table、tr、td标签在HTML代码中,table标签用来创建表格,tr用来创建行,td用来创建单元格,用法为:<table border="1"> <tr> <td>第一行第一列</td> <td>第一行第二列</td> </tr> <tr> <td>第二行第一列</td> <td>第二行第二列</td> </tr></table>11.1.1 HTML基础(6)ul、ol、li在HTML代码中,ul标签用来创建无序列表,ol标签用来创建有序列表,li标签用来创建其中的列表项。例如,下面是ul和li标签的用法:<ul id="colors" name="myColor"> <li>红色</li> <li>绿色</li> <li>蓝色</li></ul>11.1.1 HTML基础(7)div标签在HTML代码中,div标签用来创建一个块,其中可以包含其他标签,例如:<div id="yellowDiv" style="background-color:yellow;border:# FF0000 1px solid;"> <ol> <li>红色</li> <li>绿色</li> <li>蓝色</li> </ol></div><div id="reddiv" style="background-color:red"> <p>第一段</p> <p>第二段</p></div>11.1.2 JavaScript基础(1)在网页中使用JavaScript代码的方式可以在HTML标签的事件属性中直接添加JavaScript代码。例如,把下面的代码保存为index.html文件并使用浏览器打开,单击按钮“保存”,网页会弹出提示“保存成功”。<html> <body> <form> <input type="button" value="保存" onClick="alert('保存成功');"> </form> </body></html>11.1.2 JavaScript基础对于行数较多但仅在个别网页中用到的JavaScript代码,可以写在网页中的<script>标签中。例如,下面的代码保存为index.html并使用浏览器打开,会发现页面上显示的是“动态内容”而不是“静态内容”。<html> <body> <div id="test">静态内容</div> </body> <script type="text/javascript"> document.getElementById("test").innerHTML="动态内容"; </script></html>11.1.2 JavaScript基础如果一个网站中会用到大量的JavaScript代码,一般会把这些代码按功能划分到不同函数中,并把这些函数封装到一个或多个扩展名为js的文件中,然后在网页中使用。例如,和网页在同一个文件夹中的myfunctions.js内容如下:function modify(){ document.getElementById("test").innerHTML="动态内容";}在下面的页面文件中,把外部文件myfunctions.js导入,然后调用了其中的函数:<html><head>
您可能关注的文档
- Python程序设计实例教程 课件全套 董付国 项目1--14 搭建和使用Python开发环境---使用Matplotlib进行数据可视化.pptx
- Python程序设计实例教程 第2版 课件 项目13、14 使用Pandas分析与处理数据、 使用Matplotlib进行数据可视化.pptx
- Python程序设计实例教程 第2版 课件 项目7、8 使用字符串、 使用正则表达式.pptx
- Python程序设计实例教程 第2版 课件 项目9、10 读写文件内容、 文件与文件夹操作.pptx
- Python程序设计实例教程 第2版 课件 项目1、2 搭建和使用Python开发环境、 使用内置对象和运算符.pptx
- Python程序设计实例教程 第2版 课件 项目3、4 使用列表、元组、字典、集合; 使用程序控制结构.pptx
- Python程序设计实例教程 第2版 课件 项目5、6 设计和使用自定义函数、 面向对象程序设计基础.pptx
- 大学书法教程(第三版) 课件 1大学书法教程、2魏晋南北朝书法.pptx
- 大学书法教程(第三版) 课件 3南北朝书法、4隋唐五代书法.pptx
- 大学书法教程(第三版) 课件 5宋辽金元书法、6元明清.pptx
文档评论(0)