- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
HGVS基因变异命名规则
随着基因检测技术的发展及其在临床的广泛应用,越来越多与疾
病相关的基因和变异被明确。为了让变异注释更程序化、对变异文献的检索更全面化以及对变异的描述更标准化,建立统一而通用的变异命名规则变得尤为重要。
HGVS
参考序列必须是是NCBI或EBI数据库中的ID,必须同时包含accession和version信息,
如NC_000023.10,NC_000023代表编号,10代表版本号。
DNA
•g.=线性基因组参考DNA序列
•o.=环状基因组参考DNA序列
•m.=线粒体参考序列
•c.=编码DNA参考序列
•n.=非编码DNA参考序列
RNA
•r.=RNA参考序列
Protein
•p.=蛋白参考序列
特殊字符的含义
•“+”:c.123+45A>G(代表靠近内含子5’端的核苷酸发生变异)
•“-”:c.124-56C>T(代表靠近内含子3’端核苷酸发生变异);c.-142C>G(代表5’UTR区)
•“*”:c.*32G>A(代表3’UTR区);P.Trp41*(代表终止氨基酸)
表顺式,g.[123456A>G];[345678G>C]代表反式,g.123456A>G(;)345678G>C代表这
两个变异的顺式反式未知。
•“()”:用来表示不确定的或预测的结果,如p.(Ser123Arg)
•“[]”:代表等位基因,“;”用来分隔变异和等位基因,如g.[123456A>G;345678G>C]代
特殊字符的含义
•“?”:用来表示核苷酸或氨基酸的位置未知,如g.(?_234567)_(345678_?)del
•“^”:代表“或”的意思,如p.Ser124Arg反推核苷酸的改变为c.(370A>C^372C>G^372C>A),即AGC变成CGC,AGG或AGA
•“/”:表示嵌合体(mosaic),如NM_004006.1:c.145=/C>T
•“//”:表示异源嵌合体(chimeric),如NM_004006.1:c.85=//T>C
•“|”:代表不是序列的直接改变,而是一种修饰或一种状态的改变,如甲基化。
•“::”:用于描述RNA融合转录本和断点连接形成的环状染色体
缩写字符的含义
•“fs”代表变异类型为移码变异,主要是针对蛋白水平而言,如p.Arg456GlyfsTer17或p.Arg456Glyfs*17
•“ext”代表变异类型为延长,主要是针对起始密码子和终止密码子变异导致的蛋白水平的改变,如p.Met1ext-5
•“gom”表示获得甲基化,如g12345901|gom
•“lom”表示去甲基化,如g12345901|lom
•“met”表示甲基化,如g12345901|met=
编码区(CDS):以起始密码子ATG的第一个碱基A开始,并记为c.1,以终止密码子(TAA,TAG,TGA)的最后一个碱基为终点
内含子区(Intron):
Ø靠近内含子5’末端的变异位点,需依据上游最近外显子的最后一个碱基来定位,如c.87+4,代表上游最近外显子的边界位置为87,变异位点在内含子5’端开始的第4个碱基;
Ø靠近内含子3’末端的变异位点,要依据下游最近外显子的第一个碱基来定位,如c.88-11,代表下游最近的外显子的边界位置为88,变异位点在内含子3’端开始的第11个碱基;
Ø内含子碱基个数为偶数时,中间碱基平分后按上下游外显子碱基来定位命名,如…,c.87+676,c.87+677,c.87+678,c.88-678,c.88-677,c.88-676,…
Ø内含子碱基个数为奇数时,中间碱基相对于上游外显子最后一个碱基来定位命名,如…,c.87+677,c.87+678,c.87+679,c.88-678,c.88-677,…
Ø最初内含子的书写方式有两种c.88+2T>G和c.IVS2+2T>G,目前的HGVS命名规则取消c.IVS的使用,包括c.EX也不再使用。
基因结构
(3)非编码区(UTR区):
•起始密码子ATG上游(5’UTR区)标记为“-”,编号为c.-1,c.-2,c.-3…
•终止密码子下游(3’UTR区)标记为“*”,编号为c.*1,c.*2,c.*3…
•
文档评论(0)