SARS冠状病毒N蛋白序列中的核定位信号

石磊,张其鹏,芮伟,卢铭
(北京大学医学部生物信息组 100083)

1.Background
 
  1984年,Kalderon D等在对SV40 large T antigen的研究中发现,Lys-128及其周围的序列对SV40 large T antigen进入细胞核起着关键性的作用。将这段序列加到beta-galactosidase 和pyruvate kinase(两个典型的定位于细胞质中的蛋白)的C端可以使得这两个蛋白在细胞核中聚集,进一步的研究表明一段赖氨酸(Lys)和精氨酸(Arg)富集的片断PKKKRKV可以作为核定位信号序列(Kalderon D, et al ,1984)。1991年,Dingwall C在总结前人实验的基础上提出 从现有的核信号序列可找到一个统一的bipartite motif,并提出了确定bipartite motif的三条规则:(1) Two adjacent basic amino acids (Arg or Lys); (2) A spacer region of any 10 residues;(3) At least three basic residues (Arg or Lys) in the five positions after the spacer region.(Dingwall C, et al, 1991)。56%已知核蛋白符合这个规则,4%的非核蛋白的序列对这三个规则给出了阳性结果(Dingwall C, et al, 1991)。这个motif已经被收入prosite中,利用prosite进行motif预测的时候可以找出氨基酸序列中符合上述三个规则的部分。
 
 
2.方法
 
  从NCBI获得5种冠状病毒nuclecapsid protein的氨基酸序列包括:Human coronavirus 229E, Bovine coronavirus, Murine hepatitis virus, SARS virus, Avian infectious bronchitis virus。将这些序列提交到prosite进行分析。  
 
3.结果与讨论
 
  Table 1列出了通过prosite的扫描在各个冠状病毒nucleocapsid protein 中找到的可能的Motif。ASN_GLYCOSYLATION,PKC_PHOSPHO_SITE,CK2_PHOSPHO_SITE 在各个N蛋白中均存在,这可能和其motif规则不很严格有关(prosite也说明这几个motif的规则不是很确定),Bovine和SARS的都存在一个丝氨酸富集区,SARS的丝氨酸富集区与前文推断的 可能的RNA结合区重合。另外在SARS 病毒N蛋白的373-389以及374-390存在一个核转移信号序列(Table 1中用红色标出),而在其它几种N蛋白中都不存在这样一个motif。这提示SARS病毒的N蛋白有可能可以进入到宿主细胞核中,考虑到N蛋白在病毒RNA的复制以及翻译中都有着比较重要的作用,那么是否有可能SARS病毒在侵入宿主细胞以后可以进入到细胞核中,并整合到宿主DNA中?当然,以上只是建立在N蛋白含有核转移信号序列的预测结果上的猜测。由于核转移信号序列的规则并不能适用所有的核蛋白,而且有小部分非核蛋白会有阳性结果,以及由于规则本身的不完善,有可能这部分预测并不和实际相同。但是,N蛋白中含有这段特殊序列提示我们,对SARS病毒N蛋白的功能和其在SARS发病中的意义还需要更进一步的研究。  
 
Table 1.各种冠状病毒N蛋白Motif分析结果。(简写的意义请单击以后查看,单击绿色格子中的内容可以查看直接预测结果)
 
参考文献:
1.A short amino acid sequence able to specify nuclear location
2.Nuclear targeting sequences--a consensus?
Last modified: 05/11/2003