基因组二代测序数据与三代测序数据的混合校正和组装_马东娜.pdf

基因组二代测序数据与三代测序数据的混合校正和组装_马东娜.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基因组学与应用生物学,2018年,第37卷,第4期,第1547-1555页

GenomicsandAppliedBiology,2018,Vol.37,No.4,1547-1555

研究报告

ResearchReport

基因组二代测序数据与三代测序数据的混合校正和组装

1,2,3,451,2,31,2,3,451,2,3,4*1,2,3,4

马东娜张兴坦魏柳锋李仪莹钟伟民赵茜尤民生*

1福建农林大学闽台作物有害生物生态防控国家重点实验室,福州,350002福建农林大学应用生态研究所;2,福州,350002农业部闽台作物;3

有害生物综合治理重点实验室,福州,350002害虫绿色防控福建省高等学校重点实验室;4,福州,350002福建农林大学海峡联合;5研究院,福

州,350002

*共同通讯作者,zhaoqian977228@126.com;msyou@

摘要第三代单分子测序是一种通量高、速度快、读长长的新型测序技术,但是和二代测序技术相比,这种

测序方法因错误率较高而限制了其在各方面的应用。为了能有效的降低错误率、提高组装质量,本研究以拟

南芥作为研究对象,通过数据模拟等生信手段比较评估了不同软件对三代测序的纠错效率以及在不同测序

深度下的混合组装效果,以期找到最佳混合组装效果的测序深度及混装软件。通过比较四种混合校正软件

PBcR、LoRDEC、Jabba、Proovread对二代和三代数据的矫正效果。我们发现,LoRDEC以最快的速度将核酸

准确性从85%提高到99%,为评估软件中最佳选择。在LoRDEC矫正结果的基础上,为了最大限度的节省测

序成本,我们进一步分析了不同测序深度的二代(25~100)和三代(20~50)混合组装效果,以期找到成本最

××××

低、混装效果最好的测序策略。结果表明,混合组装软件DBG2OLC和三代组装软件canu能够产生更长的组

装序列和更好的基因完整性。

关键词第二代DNA测序技术,第三代DNA测序技术,混合校正,混合组装

BenchmarkingHybridCorrectio

andLongPacBioReads

1,2,3,451,2,3,41,2,3,451,2,3,4*

MaDongnaZhangXingtanWeiLiufengLiYiyingZhongWeiminZhaoQianYou

1,2,3,4*

Minsheng

Crops,MinistryofAgriculture,Fuzhou,350002

ProvinceUniversity,Fuzhou,350002

*Co-correspondingauthors,zhaoqian977228

DOI:10.13417/j.gab.037.001547

AbstractThePacificBioSciences(PacBio)sequencin

(Iso-Seq)offersgreatimprovementovercurren

andlongerreads.However,compare

PacBioisfairlyhigher,leadingtoaloweraccurac

assembly,wegeneratedthesimulatetocomparddatafrom

Arabidopsisthaliana

correcte

optimi

基金项目:本研究由国家自然科学基金(No.31320103922和No和福建省自然科学基金青年项目(No.2017J0102)共

同资助

引用格式:

马东娜,张兴坦,魏柳锋,李仪莹,钟伟民,赵茜,尤民生,2018,基因组二代测序数据与三代测序数据的混合校

37(4):1547-1555(

正和组装,基因组学与应用生物学,37(4):1547-1555)

基因组二代测序数据与三代测序数据的混合校正和组装

1548

softw

您可能关注的文档

文档评论(0)

无法显示 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档