“小陈,我要做的这个基因,NCBI上序列错啦,怎么在编码区还有终止密码子呢?”,前几天,一位老师这样问我。
学生物的都知道,细胞通过A、T、C、G(T=U)形成64种三联密码子,共计编码二十种氨基酸及三种终止密码子TAA、TGA、TAG。终止密码子都只会位于编码区最末端,而下述蛋白为何编码区中间会出现终止密码子呢,是数据库错误吗?
前几年,无论是电视上还是很多保健品商店,市场都在疯狂“硒”产品概念,什么含硒大米、硒口服液,还出现了世界硒都-恩施,并有硒产品博览会。硒是人体的微量元素,可防止因氧化而引起的衰老、减慢其变化的速度,并且它还具有活化免疫系统,预防癌症的功效,还有……
“等等,你跑题啦,我跟你谈基因,你跟我安利硒干嘛,你们公司转型卖保健品了吗?!”老师显然对我的滔滔不绝不耐烦了。
老师,您别着急,我们步入正题。NCBI数据库没有错,基因对应位置在细胞内实际就是TGA,但这个TGA不是终止密码子,而是第二十一种氨基酸:硒半胱氨酸(Sec),存在于少数一些酶中,如谷胱甘肽过氧化酶、甲状腺素5'-脱碘酶、硫氧还蛋白还原酶、甲酸脱氢酶、甘氨酸还原酶和一些氢化酶等。硒半胱氨酸的结构和半胱氨酸类似,只是其中的硫原子被硒取代。包含硒半胱氨酸残基的蛋白都称为硒蛋白,其密码子就是TGA,氨基酸简写是U:
既然TGA既是终止密码子,也是Sec的密码子,细胞如何判断TGA编码何种情况呢?实际上,所有的硒蛋白都需要一个特殊的序列--硒半胱氨酸插入序列SECIS(SElenoCysteine Insertion Sequence)辅助TGA表达为Sec,SECIS是一段含有颈环结构的序列,在细菌中直接存在于TGA密码子下游,即SECIS是一段编码序列,但其RNA含有二级结构;在古细菌以及真核生物中,SECIS位于非翻译区的3UTR。
人体共表达25二十五种硒蛋白,几乎都属于酶类蛋白,其活性催化部位含有一个硒代半胱氨酸(Sec)残基,比如GPx酶系核心生理功能是作为生物酶催化谷胱甘肽(GSH)清除人体细胞胞质、胞膜和胞外的过氧化氢、脂质过氧化物和有机过氧化物等有害代谢产物,实现微量元素硒的抗氧化能力。
人类的25种硒蛋白
由于人体无法自行合成硒,因此要额外补充。补充硒实际就是为硒蛋白的合成提供原料,实现硒蛋白功能。而硒蛋白主要通过酶促作用实现抗氧化和代谢调节等生理功能,这刚好符合人们对于美容、健康的追求,因此成为商家的一个炒作热点。
“小陈啊,我懂了,那我要在细胞过表达硒蛋白基因,有什么注意事项吗?”这位老师接着问。
有,两个注意点!
硒蛋白表达的注意事项
#1 带SECIS构建
如果是细菌的基因,比如fdhF,由于SECIS就是位于编码区,所以依然只是构建编码区即可;而对于真核基因,硒蛋白的构建一定得带上3UTR,主要是用到其中的SECIS辅助Sec的翻译。数据库收录了很多SECIS元件的序列,NCBI都可以查阅到:
#2 确认培养液是否含有硒元素
无论是体外还是体内、真核还是原核表达,若不含有硒元素,即便在SECIS的加持下,由于不含有原料供应,TGA只会翻译出终止密码子,最终会导致硒蛋白无法翻译出完整的蛋白而丧失功能。当前,原核表达一定得额外添加甲硫氨酸,细胞及动物实验可适当添加亚硒酸钠(Na2SeO3)(也有文献没写额外添加,猜测血清中含有微量的硒元素)。
本文已经列举了人源的硒蛋白,若要知悉其他物种的以及SECIS位置,看查阅数据库selenodb,其中收录了大部分物种已知的硒代蛋白。
正如人类的性别不只“男”“女”两种,密码子的世界复杂度也远超你的想象,在早期定义了二十种氨基酸之后,又发现了本文所讲的硒代半胱氨酸,之后又发现了吡咯赖氨酸(Pyrrolysine),其密码子也是TGA。只是后者目前只在产甲烷菌中出现,所以我们不做讨论。我们常规细胞的线粒体、植物的叶绿体,其密码子都常染色体都有较大差异。抛开这些不谈,人的原癌基因MYC,其起始密码子不是常规的ATG,而是CTG,但此处的CTG竟然编码ATG的甲硫氨酸,而不是CTG的亮氨酸,你说神奇不!
基因序列本身富含了很多隐藏的信息等待我们发掘,基因的解码及表达离不开对各类基因特征的充分了解,吉凯基因依托每年海量的为客户提供的定制基因服务,对基因的表达谱了然于胸,可助力您充分了解基因、分析基因、表达基因提供强有力支持,更是开发出了强表达载体、大包装容量载体,助力基因功能的研究,快来咨询吧!!!