生物序列的数据库信息检索.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物序列的数据库信息检索

NCBI数据资源 Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO:基因表达谱数据库。收集存储微阵列基因表达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含已确定基因和EST。每个簇包含唯一的非冗余的基因序列、表达的组织类型和基因图谱位点。 UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色体图形 GDS: GEO的基因表达实验与生物芯片数值结果数据库 NCBI:Entrez 检索规则 逻辑运算符(大写): AND ,OR,NOT 运算过程由左至右,()部分优先 空格分隔默认逻辑关系为 AND 多个单词短语加双引号 模糊检索使用 * 用[ ]限定字段,如限定基因名称为ATG1的检索 :ATG1[GENE] 4,双序列Blast比对实例 PDGF-related-transforming protein sis (Woolly monkey sarcoma virus) MTLTWQGDPIPEELYKMLSGHSIRSFDDLQRLLQGDSGKEDGAELDLNMTRSHSGGELESLARGKRSLGSLSVAEPAMIAECKTRTEVFEISRRLIDRTNANFLVWPPCVEVQRCSGCCNNRNVQCRPTQVQLRPVQVRKIEIVRKKPIFKKATVTLEDHLACKCEIVAAARAVTRSPGTSQEQRAKTTQSRVTIRTVRVRRPPKGKHRKCKHTHDKTALKETLGA Platelet-derived growth factor subunit B (Homo sapiens) MNRCWALFLSLCCYLRLVSAEGDPIPEELYEMLSDHSIRSFDDLQRLLHGDPGEEDGAELDLNMTRSHSGGELESLARGRRSLGSLTIAEPAMIAECKTRTEVFEISRRLIDRTNANFLVWPPCVEVQRCSGCCNNRNVQCRPTQVQLRPVQVRKIEIVRKKPIFKKATVTLEDHLACKCETVAAARPVTRSPGGSQEQRAKTPQTRVTIRTVRVRRPPKGKHRKFKHTHDKTALKETLGA BCNI: Blast 双序列比对结果 5,序列数据信息检索实例 某天,Prof. Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(phenotype),通过实验的方法(例如,酵母双杂交),发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(genotype): 问题一:这是什么基因? nucleotide blast 提交序列 Blast结果 Blast结果2 BIRC5(survivin) Gene info: 17号染色体 功能注释:Gene Ontology 结论一 1. 该基因为人的BIRC5(survivin)基因,染色体定位:17号染色体73733311;基因标识符:NM_001168.2; 2. 初步的功能分析:细胞周期,caspase酶的抑制因子,等等。 问题二:编码的蛋白质序列是怎样的? NM_001168.2 获取蛋白质的序列信息 NP_001159.2:142aa 结论二 人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.2 问题三: 有没有保守的功能结构域 (domain)? 获取FASTA序列 FASTA格式的序列 查询保守结构域 输入蛋白质的FASTA序列 BIR domain 结论三 Survivin具有保守的功能结构域BIR 问题四:它的功能是怎样的? UniProt: 蛋白质数据库 在人源数据库中做BLAST搜索 O15392 BIRC5的蛋白质信息 功能注释 结论四:功能分析 在瘤形成过程中可能起一定作用; 阻碍G2/M期的细胞编程性凋亡; Chromosomal passenger complex (CPC)的成员之一。

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档