冠状病毒疾病2019 (COVID-19)是一种新的病毒感染引起的严重急性呼吸道冠状病毒2 (SARS-CoV-2)。基因分析表明,SARS-CoV-2与穿山甲和蝙蝠冠状病毒。在这个报告中,结构比较Sars-CoV-2信封和从不同的人类的分离膜蛋白的同源蛋白质病毒密切相关。这里的分析报告显示信封和膜蛋白的结构相似度高的同行穿山甲和蝙蝠冠状病毒分离株。然而,Sars-CoV-2的比较也突出显示特定的结构差异蛋白质可能是相关的跨物种传播的属性和/或病毒。结构模型被应用到地图变体网站到预测信封,膜蛋白的三维结构。
COVID-19已成为行星紧急而严重威胁人类健康(
核苷酸和蛋白质序列已从基因库(
从基因库存储库,797年完成的基因组Sars-CoV-2收集(补充数据报告的完整列表)。TblastN程序被用来提取从每个基因组的E和M序列的蛋白质。删除冗余在每个E和M蛋白组,cd-hit集群已经应用于100%序列身份级别:相同的序列已经分配给同一组的只有一个代表被认为是进行进一步分析。Sars-CoV-2 E和M蛋白组分为三个和7个集群,分别。这一发现表明在797基因组3和7 E和M蛋白的变异可以观察到,分别。E和M同源蛋白密切相关的病毒从基因库中检索使用TblastN工具。
E蛋白是守恒的
多重序列比对中Sars-CoV-2包膜蛋白变体和一组最相似同源蛋白质。序列标签Sars-CoV-2对应参考序列确定的YP_009724392 RefSeq代码。红线以下对齐显示改变网站讨论的文本。客人背景表示守恒的对齐的位置。
大小的变体集群Sars-CoV-2信封和膜蛋白。
变体 | (没有集群大小。的序列) | 加入代码 | 定义 |
---|---|---|---|
|
|||
YP_009724392(参考) | 795年 | ||
|
|||
His37 | 1 | MT03980 | 韩国/ SNU01/2020 |
|
|||
Leu72 | 1 | MT293206 | 美国/ WA-UW-1588/2020 |
|
|||
|
|||
YP_009724393(参考) | 773年 | ||
|
|||
Ser2 | 1 | MT291836 | 中文/ Wuhan_IME-BJ07/2020 |
|
|||
Gly3 | 1 | MT325626 | 美国/ SC_3572/2020 |
|
|||
Val57, Arg89 | 1 | MT127115 | VIE / NIHE / 2020 |
|
|||
MT293184 | 美国/ WA-UW-1297/2020 | ||
lle70 | 3 | MT326166 | 美国/ WA-UW-1735/2020 |
MT293211 | 美国/ WA-UW-1591/2020 | ||
|
|||
Ser85 | 1 | MT326167 | 美国/ WA-UW-1753/2020 |
|
|||
MT326093 | 美国/ WA-UW-1775/2020 | ||
Met175 | 2 | MT246451 | 美国/ WA-UW-194/2020 |
三维模型的viroporin-like四聚物的E蛋白的组装Sars-CoV-2表示为一个卡通模型。残留突变对应网站显示在图
M跨的糖蛋白是守恒的
多重序列比对中Sars-CoV-2 M蛋白变体和一组最相似同源蛋白质。序列标签Sars-CoV-2表明YP_009724393 RefSeq的参考序列识别代码。红色框表示变体网站在氨基讨论的文本。编号下的红条多个对齐标志着跨膜螺旋的预测。连接环的位置对病毒粒子表面显示为“中”或“出”。客人背景表示守恒的对齐的位置。
M蛋白的三维模型已经被从I-Tasser服务器(代码QHD43419)作为其他方法没有找到任何合适的模板。然而,它应该提到HHpred发现薄弱的地方亲和力,尽管统计显著性水平以下,4 n31 peptidase-like蛋白质
I-Tasser膜蛋白模型表示为卡通模型。空间变异位置显示为透明的球体,并贴上氨基酸字母代码。
先前的研究指出,E和M蛋白可能是重要的病毒,人体细胞内复制,和粒子组装(
它已经表明,M蛋白在病毒膜更为普遍,它被认为是重要的冠状病毒出芽过程。事实上,病毒粒子的组装过程中,这种蛋白质与核衣壳,信封,上升,膜糖蛋白本身(
总之,这里的分析报告显示E和M蛋白的结构相似性的同行穿山甲和蝙蝠冠状病毒分离株。同时,比较强调特定Sars-CoV-2蛋白质结构差异与跨物种传播可能是相关和/或病毒的性质。虽然还需要进一步的研究,很明显,这些氨基酸变化重要病毒进化的历史,和结果可能暗示类似突变冠状病毒家族会在下一年内其他家畜流行病流行事件类似,这些天我们正在经历。
基因库中所有可用的序列数据存储库。的完整列表可以补充材料。
作者宣称没有利益冲突有关的出版。
这项工作已经在一定程度上由罗马Sapienza大学授予SP (RP11916B74B27C4D)。
补充数据由一个Excel文件,其中包含列表的797 Sars-CoV-2基因组从基因库中检索和分析。对于每个基因,序列标题显示为在基因库中找到。头报告每一行的第一个字段中加入代码后,“>”性格。