BMRI 生物医学研究的国际 2314 - 6141 2314 - 6133 Hindawi 10.1155 / 2020/4389089 4389089 研究文章 Sars-CoV-2信封和膜蛋白:结构差异与病毒特征? https://orcid.org/0000 - 0002 - 2547 - 5999 比安奇 玛蒂娜 1 https://orcid.org/0000 - 0003 - 3833 - 2927 Benvenuto 多梅尼科 2 https://orcid.org/0000 - 0002 - 5849 - 7326 Giovanetti 玛尔塔 3 https://orcid.org/0000 - 0002 - 7393 - 8732 Angeletti 西尔维亚 4 https://orcid.org/0000 - 0003 - 3866 - 9239 Ciccozzi 马西莫 2 https://orcid.org/0000 - 0002 - 6822 - 4022 Pascarella 斯特凡诺 1 安德雷德 米格尔。 1 生物科学系的“罗西把” Sapienza大学罗马 00185年罗马 意大利 uniroma1.it 2 医疗单位和分子流行病学的统计数据 大学校园Bio-Medico罗马 罗马 意大利 unicampus.it 3 黄病毒实验室 Oswaldo Cruz研究所 奥斯瓦道·克鲁兹基金会 里约热内卢 巴西 fiocruz.br 4 临床实验室科学的单位 大学校园Bio-Medico罗马 罗马 意大利 unicampus.it 2020年 30. 5 2020年 2020年 01 04 2020年 23 04 2020年 07年 05年 2020年 30. 5 2020年 2020年 版权©2020玛蒂娜·比安奇et al。 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

冠状病毒疾病2019 (COVID-19)是一种新的病毒感染引起的严重急性呼吸道冠状病毒2 (SARS-CoV-2)。基因分析表明,SARS-CoV-2与穿山甲和蝙蝠冠状病毒。在这个报告中,结构比较Sars-CoV-2信封和从不同的人类的分离膜蛋白的同源蛋白质病毒密切相关。这里的分析报告显示信封和膜蛋白的结构相似度高的同行穿山甲和蝙蝠冠状病毒分离株。然而,Sars-CoV-2的比较也突出显示特定的结构差异蛋白质可能是相关的跨物种传播的属性和/或病毒。结构模型被应用到地图变体网站到预测信封,膜蛋白的三维结构。

Sapienza大学罗马 RP11916B74B27C4D
1。介绍

COVID-19已成为行星紧急而严重威胁人类健康( 1, 2]。发展有效的治疗和预防策略显著阻碍还缺乏详细的结构信息,病毒蛋白质,虽然现在已经出现了一些Sars-CoV-2蛋白质的晶体结构( 3- - - - - - 5]。在这个报告中,结构比较Sars-CoV-2表面蛋白从不同分离株同源蛋白密切相关的病毒如蝙蝠和穿山甲。这项工作已经集中到信封(E)和膜蛋白(M),随着上升,形成病毒蛋白质接口的外部环境。的糖蛋白已经广泛研究,和一些晶体结构在蛋白质数据银行( 3- - - - - - 6];因此,这种蛋白质没有专门在此注意进行处理。识别当地的结构性差异,即使是最小的,最接近的病毒蛋白质可能表明突变使Sars-CoV-2跨越物种和/或获得其特殊的致病特性( 7, 8]。事实上,许多例子在科学文献表明已报告甚至单点突变病毒蛋白质如何大大改变他们的生物学和发病机理 9, 10]。因此,比较研究可能揭示的分子机制的流行动物流行病的起源可以出现,也可以建议分子疗法的目标或反向疫苗学实验。

2。材料和方法

核苷酸和蛋白质序列已从基因库( 11数据存储库。爆炸套件( 12)已被用于数据库搜索;Jalview [ 13]和MAFFT [ 14)已用于多个序列显示和对齐,分别。跨膜螺旋的预测已经得到TMHMM [ 15],MEMSAT [ 16),和普罗特( 17]。Cd-hit程序( 18)已被用于序列聚类。同源建模依赖瑞士模式( 19],分析员[ 20.),或HHpred [ 21开源PyMOL[]和结构显示和分析 22]。必要时,I-Tasser [ 23)被用作从头开始相同模型的替代来源。

3所示。结果 3.1。数据库搜索和结构造型

从基因库存储库,797年完成的基因组Sars-CoV-2收集(补充数据报告的完整列表)。TblastN程序被用来提取从每个基因组的E和M序列的蛋白质。删除冗余在每个E和M蛋白组,cd-hit集群已经应用于100%序列身份级别:相同的序列已经分配给同一组的只有一个代表被认为是进行进一步分析。Sars-CoV-2 E和M蛋白组分为三个和7个集群,分别。这一发现表明在797基因组3和7 E和M蛋白的变异可以观察到,分别。E和M同源蛋白密切相关的病毒从基因库中检索使用TblastN工具。

3.2。包膜蛋白

E蛋白是守恒的 β冠状病毒。只有三个变种被发现在Sars-CoV-2 E组收集。序列比较表明,Sars-CoV-2 E蛋白的参考基因组(RefSeq代码YP_009724392)相同的序列穿山甲浸MP798和蝙蝠浸CoVZXC21, CoVZC45, RaTG13隔离。图中的多重序列比对报告 1表明Sars-2-CoV E变异的特点是在69位置参数的存在,替代品Glu, Gln, Asp在其他同源冠E蛋白。这个网站是紧随其后的是删除相应位置70 g或其他蛋白质中半胱氨酸。Sars-CoV-2 E序列不同于同源蛋白质也可在职位55 -,在双Ser-Phe取代Thr-Val(除了蝙蝠冠状病毒隔离BtKY72,加入代码KY352407)。Sars-CoV-2 E蛋白不同的变体在72年37岁和他的替代品亮氨酸和亮氨酸取代守恒Pro,分别。每个信封的大小不同的集群是报道在表 1随着加入的代码和定义隔离。E蛋白的同源性模型是建立分析员使用作为模板的pentameric离子通道结构冠5 x29蛋白质由PDB标识代码。这个序列的股票91%的身份Sars-CoV-2 E蛋白和环绕的涵盖了段位置8 - 65。图 2显示的结构Sars-CoV-2 E蛋白的同源性模型组装作为pentameric viroporin-like蛋白质。图 2显示也不同站点的位置在三维模型上。预测跨膜螺旋的困难在短的蛋白质。因此,跨膜拓扑不能可靠地分配。同样,实验并没有澄清明确E蛋白的哪些部分暴露在外部或内部的病毒膜( 24]。

多重序列比对中Sars-CoV-2包膜蛋白变体和一组最相似同源蛋白质。序列标签Sars-CoV-2对应参考序列确定的YP_009724392 RefSeq代码。红线以下对齐显示改变网站讨论的文本。客人背景表示守恒的对齐的位置。

大小的变体集群Sars-CoV-2信封和膜蛋白。

变体 (没有集群大小。的序列) 加入代码 定义
信封
YP_009724392(参考) 795年

His37 1 MT03980 韩国/ SNU01/2020

Leu72 1 MT293206 美国/ WA-UW-1588/2020

YP_009724393(参考) 773年

Ser2 1 MT291836 中文/ Wuhan_IME-BJ07/2020

Gly3 1 MT325626 美国/ SC_3572/2020

Val57, Arg89 1 MT127115 VIE / NIHE / 2020

MT293184 美国/ WA-UW-1297/2020
lle70 3 MT326166 美国/ WA-UW-1735/2020
MT293211 美国/ WA-UW-1591/2020

Ser85 1 MT326167 美国/ WA-UW-1753/2020

MT326093 美国/ WA-UW-1775/2020
Met175 2 MT246451 美国/ WA-UW-194/2020

三维模型的viroporin-like四聚物的E蛋白的组装Sars-CoV-2表示为一个卡通模型。残留突变对应网站显示在图 1三维空间显示为透明的球体,并贴上氨基酸字母代码。c端部分报告模型的完整性。然而,他们没有表达结构信息由于缺乏相应的段结构模板用于同源建模。结构面板(b)由大约180°旋转 x 轴的方向所示面板(a)。

3.3。膜糖蛋白

M跨的糖蛋白是守恒的 β冠状病毒。然而,7变种Sars-CoV-2 M蛋白被发现在收集到的,只有三个变量观察E蛋白(图 3)。多重序列比对中显示了一个显著的相似性(98%身份)Sars-CoV-2 M变异蝙蝠和穿山甲的分离序列。然而,不同的氨基端位置(图 3)可以观察到:Ser残渣的插入位置4人Sars-CoV-2似乎这种蛋白质的一个独特的特征。在相应的位置,RaTG13蝙蝠M蛋白显示一个删除,而蝙蝠CoVZXC21 CoVZC45,穿山甲MP789蛋白质有一个Asp残渣。7 M蛋白变体在不同位置2,3,57岁,70年,85年、89年和175年。每个膜的大小不同的集群是报道在表 1随着加入的代码和定义隔离。值得注意的,蛋白质从Sars-CoV-2 NIHE隔离(加入代码MT127115)具有一个参数,而不是一个守恒的g在89(图位置 3)。突变发生在预测跨膜螺旋,如果得到证实,可能产生重大影响的蛋白质属性(图 3)。

多重序列比对中Sars-CoV-2 M蛋白变体和一组最相似同源蛋白质。序列标签Sars-CoV-2表明YP_009724393 RefSeq的参考序列识别代码。红色框表示变体网站在氨基讨论的文本。编号下的红条多个对齐标志着跨膜螺旋的预测。连接环的位置对病毒粒子表面显示为“中”或“出”。客人背景表示守恒的对齐的位置。

M蛋白的三维模型已经被从I-Tasser服务器(代码QHD43419)作为其他方法没有找到任何合适的模板。然而,它应该提到HHpred发现薄弱的地方亲和力,尽管统计显著性水平以下,4 n31 peptidase-like蛋白质 酿脓链球菌必不可少的纤毛聚合。图 4网站上显示的位置变体模型结构。这个模型已经被从头开始预测技术。因此,它应该考虑应该谨慎使用作为一个低分辨率的近似真实的结构。根据预测跨膜螺旋的拓扑中,N和M蛋白的c端部分暴露内外病毒粒子,分别(图 4)。

I-Tasser膜蛋白模型表示为卡通模型。空间变异位置显示为透明的球体,并贴上氨基酸字母代码。

4所示。讨论

先前的研究指出,E和M蛋白可能是重要的病毒,人体细胞内复制,和粒子组装( 24, 25]。根据公认的理论,当前COVID-19大流行已引起的跨物种传播的 β冠状病毒通常由蝙蝠和,也许,穿山甲对人类[ 3, 26]。本文从797 E和M蛋白Sars-CoV-2基因组已经比同行从最密切相关的病毒也评估氨基酸突变的潜在作用家畜流行病COVID-19的起源。病毒E蛋白是一种微量组分的膜虽然被认为是重要的对于许多阶段的病毒感染和复制( 24, 25]。序列比较表明,这种蛋白质是相同的同行的特定的蝙蝠和穿山甲冠状病毒隔离,即使Sars-CoV-2序列似乎拥有特定的修改和其他特征对Sars浸。特别是Arg69,带正电氨基酸,取代Glu或Gln残留物,带负电荷的和中性的,分别在x和相应的蛋白质。此外,删除特定Sars-CoV-2蛋白质侧翼这个职位。不幸的是,它是不可能可靠地预测这些修改的网站是否暴露在内部或外部的膜。在任何情况下,替换和删除一个相当激烈的变化和可能构象性质产生重大影响,可能对蛋白质-蛋白质之间的关系。进一步的结构性研究是必要的。然而,它可能会推测,这些变化还会影响齐聚反应过程需要形成一个跨膜离子通道。

它已经表明,M蛋白在病毒膜更为普遍,它被认为是重要的冠状病毒出芽过程。事实上,病毒粒子的组装过程中,这种蛋白质与核衣壳,信封,上升,膜糖蛋白本身( 25]。此外,在Alphacoronaviruses,证明了这种蛋白质与的合作在细胞附着和条目( 27]。因此,突变发生n端区域,这是暴露在病毒表面,可以在宿主细胞中发挥关键作用的相互作用。

总之,这里的分析报告显示E和M蛋白的结构相似性的同行穿山甲和蝙蝠冠状病毒分离株。同时,比较强调特定Sars-CoV-2蛋白质结构差异与跨物种传播可能是相关和/或病毒的性质。虽然还需要进一步的研究,很明显,这些氨基酸变化重要病毒进化的历史,和结果可能暗示类似突变冠状病毒家族会在下一年内其他家畜流行病流行事件类似,这些天我们正在经历。

数据可用性

基因库中所有可用的序列数据存储库。的完整列表可以补充材料。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作已经在一定程度上由罗马Sapienza大学授予SP (RP11916B74B27C4D)。

补充材料

补充数据由一个Excel文件,其中包含列表的797 Sars-CoV-2基因组从基因库中检索和分析。对于每个基因,序列标题显示为在基因库中找到。头报告每一行的第一个字段中加入代码后,“>”性格。

Benvenuto D。 Giovanetti M。 Ciccozzi 一个。 Spoto 年代。 Angeletti 年代。 Ciccozzi M。 2019 -新冠状病毒流行:病毒进化的证据 医学病毒学杂志 2020年 92年 4 455年 459年 10.1002 / jmv.25688 31994738 c c。 陈宗柏。 Ko 观测。 周宏儒。 松林 P.-R。 严重急性呼吸系统综合症冠状病毒(SARS-CoV-2)和冠状病毒疾病- 2019 (COVID-19):流行和挑战 国际期刊的抗菌药物 2020年 55 3,第105924条 10.1016 / j.ijantimicag.2020.105924 32081636 Benvenuto D。 Giovanetti M。 生活 M。 Prosperi M。 de植物 C。 初级阿尔坎塔拉 l . C。 Angeletti 年代。 Ciccozzi M。 2019年的全球传播- ncov:分子进化分析 病原体和全球卫生 2020年 114年 2 64年 67年 10.1080 / 20477724.2020.1725339 32048560 a . C。 公园 Y.-J。 Tortorici m·A。 一个。 McGuire a . T。 Veesler D。 结构、功能和抗原性的糖蛋白SARS-CoV-2飙升 细胞 2020年 181年 2 281年 292. e6 10.1016 / j.cell.2020.02.058 32155444 Wrapp D。 N。 Corbett k . S。 戈德史密斯 j . A。 谢长廷 C.-L。 阿比欧娜 O。 格雷厄姆 b S。 McLellan j·S。 低温电子显微镜的结构2019 - ncov激增十二构象 科学 2020年 367年 6483年 1260年 1263年 10.1126 / science.abb2507 32075877 杨ydF4y2Ba R。 Y。 Y。 l Y。 Q。 结构性基础识别人类ACE2 SARS-CoV-2的长篇 科学 2020年 367年 6485年 1444年 1448年 10.1126 / science.abb2762 32132184 Angeletti 年代。 Benvenuto D。 比安奇 M。 Giovanetti M。 Pascarella 年代。 Ciccozzi M。 COVID 2019:应承担的角色Nsp2 Nsp3的发病机理 医学病毒学杂志 2020年 92年 6 584年 588年 10.1002 / jmv.25719 W。 W。 X。 J。 X。 跨物种应承担2019 - ncov新发现的冠状病毒的传播 医学病毒学杂志 2020年 92年 4 433年 440年 10.1002 / jmv.25682 31967321 安德烈 n·M。 Cossic B。 戴维斯 E。 米勒 答:D。 惠塔克 g·R。 不同突变的猫科动物冠状病毒突起蛋白乳沟激活网站猫与猫传染性peritonitis-associated Meningoencephalomyelitis 猫科医学与外科杂志》公开报告 2019年 5 1 10.1177 / 2055116919856103 31534775 酒井法子 Y。 Kawachi K。 田农 Y。 Omori H。 Y。 神谷之康 W。 Two-amino酸变化Nsp4 SARS冠状病毒消除病毒复制 病毒学 2017年 510年 165年 174年 10.1016 / j.virol.2017.07.019 2 - s2.0 - 85025088501 28738245 本森 d . A。 瓦诺 M。 克拉克 K。 Karsch-Mizrachi 我。 Ostell J。 普瑞特 k·D。 塞耶斯 e·W。 基因库 核酸的研究 2018年 46 D1 18 D47 10.1093 / nar / gkx1094 2 - s2.0 - 85040949299 29140468 Altschul 年代。 马登 t . L。 谢弗 答:一个。 J。 Z。 米勒 W。 Lipman d . J。 有缺口的爆炸和PSI-BLAST:新一代的蛋白质数据库搜索程序 核酸的研究 1997年 25 17 3389年 3402年 10.1093 / nar / 25.17.3389 2 - s2.0 - 0030801002 9254694 沃特豪斯 a . M。 宝洁公司 j·B。 马丁 d·m·A。 M。 巴顿 g . J。 Jalview版本2——一个多重序列比对编辑和分析工作台 生物信息学 2009年 25 9 1189年 1191年 10.1093 /生物信息学/ btp033 2 - s2.0 - 65449188232 19151095 Katoh K。 史坦利 d . M。 MAFFT多重序列比对软件版本7:改善性能和可用性 分子生物学与进化 2013年 30. 4 772年 780年 10.1093 / molbev / mst010 2 - s2.0 - 84875619226 23329690 Y。 P。 J。 Y。 分泌蛋白预测系统结合CJ-SPHMM TMHMM, PSORT 哺乳动物的基因组 2003年 14 12 859年 865年 10.1007 / s00335 - 003 - 2296 - 6 2 - s2.0 - 0345490814 14724739 McGuffin l . J。 布赖森 K。 琼斯 d . T。 PSIPRED蛋白质结构预测服务器 生物信息学 2000年 16 4 404年 405年 10.1093 /生物信息学/ 16.4.404 2 - s2.0 - 0034044314 10869041 Omasits U。 Ahrens c . H。 穆勒 年代。 Wollscheid B。 防:互动蛋白质特性与蛋白质组学实验数据可视化和一体化 生物信息学 2014年 30. 6 884年 886年 10.1093 /生物信息学/ btt607 2 - s2.0 - 84897873840 24162465 l 妞妞 B。 Z。 年代。 W。 CD-HIT:加速集群下一代测序数据 生物信息学 2012年 28 23 3150年 3152年 10.1093 /生物信息学/ bts565 2 - s2.0 - 84870431038 23060610 沃特豪斯 一个。 M。 Bienert 年代。 瑞士思德利公司 G。 Tauriello G。 Gumienny R。 陆军 f . T。 德啤酒 t·a·P。 Rempfer C。 Bordoli l Lepore R。 Schwede T。 瑞士模式:同源蛋白质结构造型和复合物 核酸的研究 2018年 46 W1 W296 W303 10.1093 / nar / gky427 2 - s2.0 - 85050235281 29788355 韦伯 B。 萨利· 一个。 蛋白质结构建模分析与建模 分子生物学方法 2017年 1654年 39 54 10.1007 / 978 - 1 - 4939 - 7231 - 9 - _4 2 - s2.0 - 85030789714 齐默尔曼 l 史蒂芬斯 一个。 不结盟运动 S.-Z。 D。 Kubler J。 Lozajic M。 加布勒 F。 草皮 J。 领袖 a . N。 阿尔瓦 V。 一个完全重新实现MPI生物信息学工具和一个新的HHpred服务器的核心 分子生物学杂志 2018年 430年 15 2237年 2243年 10.1016 / j.jmb.2017.12.007 2 - s2.0 - 85039747573 29258817 薛定谔 l . l . C。 AxPyMOL分子图形系统,2.0版本 2015年 薛定谔,LLC。 J。 杨ydF4y2Ba R。 罗伊 一个。 D。 泊松 J。 Y。 I-TASSER套件:蛋白质结构和功能预测 自然方法 2015年 12 1 7 8 10.1038 / nmeth.3213 2 - s2.0 - 84925156346 25549265 斯科曼 D。 菲尔丁 b . C。 冠状病毒包膜蛋白:当前的知识 病毒学杂志 2019年 16 1 69年 10.1186 / s12985 - 019 - 1182 - 0 2 - s2.0 - 85066411645 31133031 Alsaadi e·a·J。 琼斯 i M。 冠状病毒的膜结合蛋白 未来的病毒学 2019年 14 4 275年 286年 10.2217 / fvl - 2018 - 0144 2 - s2.0 - 85065672669 32201500 R。 X。 J。 妞妞 P。 B。 H。 W。 首歌 H。 B。 N。 Bi Y。 X。 张ydF4y2Ba F。 l T。 H。 Z。 W。 l J。 Y。 J。 Y。 J。 Z。 J。 w·J。 D。 W。 福尔摩斯 e . C。 g F。 G。 W。 W。 唐ydF4y2Ba W。 基因组描述2019年的小说《冠状病毒和流行病学:影响病毒的起源和受体结合 《柳叶刀》 2020年 395年 10224年 565年 574年 10.1016 / s0140 - 6736 (20) 30251 - 8 32007145 Naskalska 一个。 那里好 一个。 Szczepanski 一个。 Milewska 一个。 Jasik k P。 Pyrc K。 人类冠状病毒膜蛋白NL63负责与粘附受体相互作用 病毒学杂志 2019年 93年 19 455年 459年 10.1128 / jvi.00355-19 2 - s2.0 - 85072153784 31315999