SARS冠状病毒蛋白质初步分析(III)
--- Where does the virus' RNA polymerase come from?
芮伟, 张其鹏, 石磊, 卢铭
(北京大学医学部生物信息组, 100083) |
背景概述:
SARS冠状病毒,和同家族的其他冠状病毒一样,是一类单链的正义RNA病毒 ( single-stranded, (+)sense RNA Virus)。与其他种类的病毒(如负义RNA病毒)相比,这类病毒有两个最重要的特征:
|
1. 在其成熟的病毒颗粒中并没有RNA聚合酶存在,即病毒复制、转录所需的病毒特有的RNA聚合酶(Viral RNA Polymerase),是在侵入宿主细胞之后才合成的! 而且,只是在病毒的扩增阶段,保留在宿主细胞内行使功能,并不参与病毒颗粒的组装。
2. 其基因组RNA(Genomic RNA)本身就包括有5`-甲基化帽子和3`-PolyA尾巴,即基因组RNA自身就可以发挥mRNA样的功能,参与病毒蛋白质的合成!
|
已知的冠状病毒侵入宿主细胞后的一系列复制、转录、翻译过程,如图1所示:

图1 冠状病毒复制过程示意图 (图片来源:The Nidoviruses (Coronaviruses
and Arteriviruses) )
由此可见,SARS冠状病毒的RNA聚合酶,是SARS侵入宿主细胞之后,启动其他一切生命活动的关键蛋白质!确定该蛋白质的编码基因结构、明确其翻译及调控过程,将成为了解SARS冠状病毒生命活动规律的一个关键点。同时,也能够为针对SARS的特异性药物或疫苗的研发,提供重要靶点/抗原及设计思路。
目的:
通过运用生物信息学的工具,在本研究组对NCBI公布的SARS基因组及蛋白质初步分析基础上(见),着重对可能编码14个蛋白质的orf1ab,参照已知的几种冠状病毒RNA聚合酶,进行序列同源性分析,试图对SARS
RNA聚合酶(SARS RNA Polymerase)编码基因的位置、序列及结构,给予更为准确的推断。
方法与结果:
首先,我们对NCBI预测的orf1ab可能翻译产生的14个蛋白质(LeaderProtein除外),逐一运用BlastP
寻找其同源蛋白质序列。为保证得到的同源序列为真实存在的病毒蛋白质,我们在BlastP参数设定时,"Protein Database"仅选择
"SwissProt", "database subsection"仅选择"Viruses","E threshold"使用默认值"10"。
运行结果见表1。
BlastP
Result of SARS Coronavirues Putative orf1ab Proteins
(Table 1)
|
| |
| |
如果对BlastP的结果进行仔细分析和归类,我们不难发现以下规律:
(注:由于其中“putative counterpart of MHV p65 protein”找到的同源序列,并非为冠状病毒序列,故暂时将其排除在讨论范围之外。)
基于上述分类规律,我们推断SARS冠状病毒RNA聚合酶的合成模式,很可能与上述两个Strain的MHV RNA聚合酶非常相似。即:RNA Polymerase由两个ORF分别编码。换言之,即:
1.SARS冠状病毒的ORF1ab可能并非能够表达出实际存在的蛋白质,而是由两个相邻的ORF(暂时命名为SARS_ORF1a和SARS_ORF1b)编码;(如图2)  图2 ORFa/b示意图
2.SARS基因组的前21KB的基因组,实际上只编码一个"最重要的蛋白质"--RNA Polymerase,而不是14个蛋白质! |
为确证上述推断,我们应用GeneDoc,将SARS冠状病毒819...1369段、SARS冠状病毒4370...7073段和Murine coronavirus
MHV (strain JHM) RNA-directed RNA polymerase (ORF1A,P19751/ORF1B,P29982)、Murine
coronavirus MHV (strain A59) RNA-directed RNA polymerase (ORF1A,P19750/ORF1B,P16342)分别进行了Pairwise
Alignment。结果如下:
推断与讨论:
由BlastP与交叉比对结果,我们可以作出以下推断:
1.SARS冠状病毒的RNA Polymerase,很可能是由两个完全不同的ORF,即ORF1a(250...13356)和ORF1b(13357...21470)分别编码,然后组装成成熟的聚合酶,而不是一个ORF编码之后,切割再组装而成。
2.两个ORF与不同Strain的冠状病毒的同源性关系分析可以表明:ORF1b部分比ORF1a更为保守,提示ORF1b可能是
RNA聚合酶的核心部分。另外,SARS两个ORF和已知冠状病毒的同源性差异,可以对两个ORF的来源,甚至SARS病毒的来源有提示作用。进一步的结论,有赖于对已知各Coronaviruses和SARS病毒株的基因组突变分析。
3.这两个ORF的翻译及调控机制尚不明确,尤其值得注意的是:可能不依赖于基因组RNA上250..2703这一段的Leader序列与非保守序列,而可以独立地启动翻译过程。这样的翻译机制可以极大提高病毒进入宿主细胞后合成其复制必需的RNA聚合酶的效率,缩短基因组RNA在细胞浆内"孤立存在"的时间,进而提高生存的可能性。上述机制,也可以解释SARS冠状病毒的毒力为何远远高于同类其他冠状病毒,可以在短期内造成组织细胞严重损伤,形成急性症状。进一步的结论,有赖于对250aa之前序列等部分进一步的分析判断。
|
参考文献:
All copyright reserved by CMBI©2003
2003-5-1
|