SARS冠状病毒蛋白质初步分析(III)

--- Where does the virus' RNA polymerase come from?

芮伟, 张其鹏, 石磊, 卢铭
(北京大学医学部生物信息组, 100083)

背景概述:

SARS冠状病毒,和同家族的其他冠状病毒一样,是一类单链的正义RNA病毒 ( single-stranded, (+)sense RNA Virus)。与其他种类的病毒(如负义RNA病毒)相比,这类病毒有两个最重要的特征:

1. 在其成熟的病毒颗粒中并没有RNA聚合酶存在,即病毒复制、转录所需的病毒特有的RNA聚合酶(Viral RNA Polymerase),是在侵入宿主细胞之后才合成的! 而且,只是在病毒的扩增阶段,保留在宿主细胞内行使功能,并不参与病毒颗粒的组装。

2. 其基因组RNA(Genomic RNA)本身就包括有5`-甲基化帽子和3`-PolyA尾巴,即基因组RNA自身就可以发挥mRNA样的功能,参与病毒蛋白质的合成!


已知的冠状病毒侵入宿主细胞后的一系列复制、转录、翻译过程,如图1所示:

图1 冠状病毒复制过程示意图
(图片来源:The Nidoviruses (Coronaviruses and Arteriviruses)

由此可见,SARS冠状病毒的RNA聚合酶,是SARS侵入宿主细胞之后,启动其他一切生命活动的关键蛋白质!确定该蛋白质的编码基因结构、明确其翻译及调控过程,将成为了解SARS冠状病毒生命活动规律的一个关键点。同时,也能够为针对SARS的特异性药物或疫苗的研发,提供重要靶点/抗原及设计思路。

 

目的:

通过运用生物信息学的工具,在本研究组对NCBI公布的SARS基因组蛋白质初步分析基础上(见),着重对可能编码14个蛋白质的orf1ab,参照已知的几种冠状病毒RNA聚合酶,进行序列同源性分析,试图对SARS RNA聚合酶(SARS RNA Polymerase)编码基因的位置、序列及结构,给予更为准确的推断。

方法与结果:

首先,我们对NCBI预测的orf1ab可能翻译产生的14个蛋白质(LeaderProtein除外),逐一运用BlastP 寻找其同源蛋白质序列。为保证得到的同源序列为真实存在的病毒蛋白质,我们在BlastP参数设定时,"Protein Database"仅选择 "SwissProt", "database subsection"仅选择"Viruses","E threshold"使用默认值"10"。 运行结果见表1。

BlastP Result of SARS Coronavirues Putative orf1ab Proteins
(Table 1)

Protein Name Location Length Accession BlastP Result Graphic Result
putative counterpart of MHV p65 protein 180..818 639 NP_828861.1 MHV p65 MHV p65
putative coronavirus nsp1 819..3240 2422 NP_828862.1 nsp1 nsp1
putative coronavirus nsp2 3241..3546 306 NP_828863.1 nsp2 nsp2
putative coronavirus nsp3 3547..3836 290 NP_828864.1 nsp3 nsp3
putative coronavirus nsp4 3837..3919 83 NP_828865.1 nsp4 nsp4
putative coronavirus nsp5 3920..4117 198 NP_828866.1 nsp5 nsp5
putative coronavirus nsp6 4118..4230 113 NP_828867.1 nsp6 nsp6
putative coronavirus nsp7 4231..4369 139 NP_828868.1 nsp7 nsp7
putative coronavirus nsp9 4370..5301 932 NP_828869.1 nsp9 nsp9
putative coronavirus nsp10 5302..5902 601 NP_828870.1 nsp10 nsp10
putative coronavirus nsp11 5903..6429 527 NP_828871.1 nsp11 nsp11
putative coronavirus nsp12 6430..6775 346 NP_828872.1 nsp12 nsp12
putative coronavirus nsp13 6776..7073 298 NP_828873.2 nsp13 nsp13
 
如果对BlastP的结果进行仔细分析和归类,我们不难发现以下规律:
(注:由于其中“putative counterpart of MHV p65 protein”找到的同源序列,并非为冠状病毒序列,故暂时将其排除在讨论范围之外。)
1. 上述12个推测蛋白,均可找到有序列同源性的相应冠状病毒RNA Polymerase;但是,nsp1-7和nsp9-13所找到的同源序列及序列同源程度,均有明显差异。
2. nsp1-7共有的同源序列为RRPA_CVMJH(P19751),即 Murine coronavirus MHV (strain JHM) RNA-directed RNA polymerase (ORF1A)。且同源性在48%-70%之间,Score值均不高。
3. nsp9-13共有的同源序列则为RRPB_CVMA5(P16342),即Murine coronavirus MHV (strain A59) RNA-directed RNA polymerase (ORF1B)。且同源性在61-80%之间,Score值明显高于nsp1-7组。


基于上述分类规律,我们推断SARS冠状病毒RNA聚合酶的合成模式,很可能与上述两个Strain的MHV RNA聚合酶非常相似。即:RNA Polymerase由两个ORF分别编码。换言之,即:

1.SARS冠状病毒的ORF1ab可能并非能够表达出实际存在的蛋白质,而是由两个相邻的ORF(暂时命名为SARS_ORF1a和SARS_ORF1b)编码;(如图2)


图2 ORFa/b示意图

2.SARS基因组的前21KB的基因组,实际上只编码一个"最重要的蛋白质"--RNA Polymerase,而不是14个蛋白质!


为确证上述推断,我们应用GeneDoc,将SARS冠状病毒819...1369段、SARS冠状病毒4370...7073段和Murine coronavirus MHV (strain JHM) RNA-directed RNA polymerase (ORF1A,P19751/ORF1B,P29982)、Murine coronavirus MHV (strain A59) RNA-directed RNA polymerase (ORF1A,P19750/ORF1B,P16342)分别进行了Pairwise Alignment。结果如下:

Align Object
Align Result
SARS_ORF1a v.s. P19750 ORF1a_P19750.msf
SARS_ORF1a v.s. P19751 ORF1a_P19751.msf
SARS_ORF1b v.s. P16342 ORF1b_P16342.msf
SARS_ORF1b v.s. P29982 ORF1b_P29982.msf

 

推断与讨论

由BlastP与交叉比对结果,我们可以作出以下推断:

1.SARS冠状病毒的RNA Polymerase,很可能是由两个完全不同的ORF,即ORF1a(250...13356)和ORF1b(13357...21470)分别编码,然后组装成成熟的聚合酶,而不是一个ORF编码之后,切割再组装而成。

2.两个ORF与不同Strain的冠状病毒的同源性关系分析可以表明:ORF1b部分比ORF1a更为保守,提示ORF1b可能是 RNA聚合酶的核心部分。另外,SARS两个ORF和已知冠状病毒的同源性差异,可以对两个ORF的来源,甚至SARS病毒的来源有提示作用。进一步的结论,有赖于对已知各Coronaviruses和SARS病毒株的基因组突变分析。

3.这两个ORF的翻译及调控机制尚不明确,尤其值得注意的是:可能不依赖于基因组RNA上250..2703这一段的Leader序列与非保守序列,而可以独立地启动翻译过程。这样的翻译机制可以极大提高病毒进入宿主细胞后合成其复制必需的RNA聚合酶的效率,缩短基因组RNA在细胞浆内"孤立存在"的时间,进而提高生存的可能性。上述机制,也可以解释SARS冠状病毒的毒力为何远远高于同类其他冠状病毒,可以在短期内造成组织细胞严重损伤,形成急性症状。进一步的结论,有赖于对250aa之前序列等部分进一步的分析判断。

参考文献

All copyright reserved by CMBI©2003

2003-5-1