- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
生物信息学札记 (第4 版)
樊龙江
浙江大学作物科学研究所
浙江大学生物信息学研究所
浙江大学 IBM生物计算实验室
2017年9月
本材料已由浙江大学出版社出版:《生物信息学》,樊龙江主编,2017
部分内容可通过下列网址获得:
/bioinplant/
札记前言
第一版
这份材料是我学习和讲授 《生物信息学》课程时的备课笔记,材料大多是根据当时收集的一
些外文资料翻译编辑而成。学生在学习过程中经常要求我给他们提供一些中文的讲义或材
料,这促使我把我的这份笔记整理并放到网上,供大家参考。要提醒使用者的是,这份材料
仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者自鉴
了。
2001年6 月
第二版
自1999 年开始接触生物信息学以来,一晃已近六年,而本札记也近四岁了。2001和2002
年中国科学院理论物理所的郝柏林院士在浙江大学首次开设生物信息学研究生课程,我作为
他的助教系统地学习了生物信息学;同时,借着我国水稻基因组测序计划的机遇,在他的带
领下从2001年开始从事水稻基因组分析,从此自己便完全投入到这一崭新、引人入胜的领
域中来。
不断有来信向我索要本札记的电子版文件,同时在不少网站上看到推荐该札记的内容。生物
信息学、基因组学等发展很快,现在再回头审看该札记,有些部分已惨不忍读,这促使我下
决心更新它。但因时间和学识问题,还是有不少部分自己不甚满意,就只有待日后再努力了。
欢迎告诉我札记中的BUG,我的信箱fanlj@ 或bioinplant@。
2005年3 月30 日
第三版
近年来高通量测序技术产生的序列数据大量出现 (如小RNA 和大规模群体SNP 数据),本
次更新根据这一进展增加了两章内容,分别是第七章有关小RNA 的分析和第八章遗传多态
性及正向选择检测。两章内容由我的博士生王煜为主编写,李泽峰和刘云参与了文献整理。
另外还更新了第四章有关水稻基因组分析一节。
2010年1月
第四版
2014年浙江大学开展本科生教材建设工作,我当时作为系主任要带头,就承诺编写我主讲
的 《生物信息学》教材。编写教材的确不是一件容易的事,经过几番挣扎和多方努力,总算
完成了编写,算是了却了一桩心思。该教材内容比较完整,也跟踪了生物信息学领域的最新
进展。我就权且把该教材内容作为札记的第四版,也算给该札记一个完美的结尾。
2017年9月
II
III
《生物信息学》
前言
自开始接触生物信息学以来,一晃已近二十年了。我是在攻读博士期间开始
注意并学习生物信息学的。我的博士生导师胡秉民为应用数学专业教授,主要从
事生态系统模型模拟研究。虽然已具备一定数量统计和数量遗传学基础,但当时
对于生物信息学,我还是非常陌生的,通过自学才开始一点点了解这门新兴学科。
2001-2003年间,中国科学院理论物理所郝柏林院士在浙江大学首次开设“生物
信息学”研究生课程,我作为他的助教,系统地学习了生物信息学;同时,在他
的带领下从事水稻基因组分析。自那时起,浙江大学生物信息学学科和相应研究
机构也逐步建立起来。2004年郝院士离开杭州加入复旦大学,生物信息学研究
生课程就由我和朱军教授承担下来。现在该课程作为浙江大学全校性研究生公共
课程,已成为一门重点建设课程,每年选课人数都在150人左右。
上个世纪末,我国生物信息学还处于起步阶段,学习资料很少。学生时常索
要学习材料,于是我整理了备课笔记,取名 《生物信息学札记》,于2001年6
月挂到实验室主页上供学生参考。随着生物信息学发展,分别于2005年3月和
2010年1月更新札记两次。由于网络传播的作用,许多生物信息学初学者都读
过该札记,在国内形成一定的影响。本书是在该札记框架基础上,补充大量新材
料编写而成。
生物信息学学科内容涵盖广且发展很快。基于国内外生物信息学相关教材,
以及自身对生物信息学的粗浅理解,我把生物信息学大致分为四部分(篇)内容:
第一部分即基础篇,为生物信息学的基础知识。这部分内容总体变化不大 (与
10-15年前比较),它是生物信息学的核心知识,生物信息学教学最重要部分,
为应为必讲内容;第二部分高通量测序数据分析篇,最近十年才出现的生物信息
学新内容。2005年高通量测序技术突破后,针对该技术产生的序列数据,出现
大量生物信息学新算法和新工具;第三部分生物信息学外延与交叉
文档评论(0)