编译丨范东东
蛋白质组学是当前生物制药发展非常迅速的热门领域之一,研究蛋白质组学不但能够加深对支持跨细胞、组织和整个生物体的生物状态分子过程的理解,还能够帮助包括人类、动物和植物生物学、个性化医学和法医学在内的各个科学研究领域快速发展。这些研发收益在很大程度上都要归功于蛋白质组学技术、数据处理能力和数据共享的进步。在本文中,我们将与世界各地的蛋白质组学权威专家一起,共同探讨蛋白质组学的最新进展及其更广泛的潜在影响。
一、蛋白质组学关键技术发展
1、质谱蛋白质组学
蛋白质组学研究采用的分析技术大致分为低通量和高通量两类。几十年来,质谱(MS)一直是在高通量分析中最广泛使用的“金标准”。从历史上看,基于质谱的蛋白质组学面临的一项关键问题就是敏感性和特异性,不过近年来,质谱技术的格局发生了翻天覆地的变化。供应商推出了具有高速度、灵敏度和特异性功能的质谱仪器,科学家们现在也可以凭借这些新型仪器更加深入研究蛋白质组学。
诺和诺德基金会蛋白质研究中心蛋白质组学项目的研究主任和组长Matthias Mann教授在被问及质谱蛋白质组学的突破时,特别强调了Aebersold实验室率在数据独立采集(DIA)方面的进展。与其姊妹技术数据相关分析(DDA)不同的是,DIA在第二个循环(MS2)中将串联MS(MS1)第一个循环中产生的所有前体离子分解,这也为研究人员提供了更好的无偏分析能力、更大的蛋白质组覆盖率和更高的再现性。近年来,在蛋白质组学研究,特别是在肿瘤学领域,使用基于DIA质谱的频率也一直在持续增长。此外,DIA技术还在神经科学蛋白质组学领域取得了积极进展,包括发现了阿尔茨海默病的相关信息。
2、基于适体的蛋白质组学
虽然质谱技术多年来一直在蛋白质组学研究领域占据主导地位,但最近出现的“第二代”蛋白质组学平台则是利用基于适体开发的新型技术。约翰霍普金斯大学医学院研究员Benjamin Orsburn博士也表示,尽管LC-MS在蛋白质组学领域已经垄断了几十年,但现在的情况显然已不再如此。
适体是一种短的单链(ss)DNA分子,能够进行独特的匹配确认,选择性地与生物靶标结合。在生物标志物发现等领域,该技术具有特异性和选择性等优势,因此要优于受到动态范围限制的MS蛋白质组学。此前,研究人员基于适体的蛋白质组学对来自Framingham心脏研究中的1895名女性进行了研究,以便确定心脏重塑和心力衰竭事件的生物标志物。试验结果显示,17种蛋白质被发现与超声心动图特征相关,6种蛋白质与心力衰竭事件相关,利用遗传变异数据的进一步分析也进一步支持了这些发现。
Orsburn表示,与LC-MS技术相比,适体技术的使用将更少受到细胞中绝对蛋白质拷贝数的影响。然而,在能够识别更高百分比的蛋白质组之前,质谱蛋白质组学目前可能仍然将会是首选方法,而基于适体的技术通常会做为补充和辅助方法。最近,有研究人员提出的理想蛋白质测序平台,采用了条形码DNA适体来识别肽的末端氨基酸,连接到下一代测序芯片可能会成为折衷方案。Orsburn对此称该领域的全部研发潜力仍需要一定的时间才能实现。
二、人工智能和蛋白质组学
1、人工智能和药物发现蛋白质组学
人工智能(AI)在蛋白质组学中的应用已经深刻改变了药物发现领域的研发工作。对研发人员来说,深入了解特定蛋白质如何以及为何能够相互作用,对于推进细胞生物学、开发新药和确定药物引发治疗和副作用的机制至关重要,然而这绝非易事。美国麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Octavian-Eugen Ganea表示,为了掌握互相作用的蛋白质如何相互连接,必须通过人工或计算机手段尝试所有可能的连接组合,以便找到最合理的连接组合,而如果不借助人工智能单纯使用人工进行,将会是一个非常耗时的过程。
目前已有多种商业化的蛋白质对接方法可供选择,但它们都依赖于候选采样、模板和预计算网格的特定任务特征,而这些因素都会增加额外的计算时间。麻省理工学院Ganea团队最近发表了一种新的深度学习模型EquiDock,采用了两种蛋白质的3D结构,并能直接识别哪些区域可能会发生相互作用。EquiDock模型能够从约41000个蛋白质结构中捕获复杂的对接模式,使用了具有数千个参数的几何约束模型,这些参数能够动态地在计算过程中自动调整。
训练完成后,EquiDock模型将与其他四个现有的对接软件进行交叉比较,并且能够在一到五秒内预测最终的蛋白质复合物,速度比现有软件快80至500倍。Ganea表示,药物副作用的快速计算扫描是非常必要的,能够显著减少搜索范围,否则即便整合了全球的人工试验资源,也无法取得满意的结果。他强调称,将EquiDock模型与其他蛋白质结构预测模型相结合,将有望进一步帮助其在药物设计、蛋白质工程、抗体生成和作用机制研究等方面的应用。
2、人工智能和质谱蛋白质组学
基于人工智能的方法还将帮助研究人员从获得的数据中获得更多的研发见解。质谱实验需要数据库搜索或光谱库匹配来识别特定的蛋白质。整个过程不但特别耗费时间,而且某些蛋白质还可能会被错误识别或遗漏,对于依赖于通过DDA分析生成光谱库的DIA质谱技术来说,这些弊端似乎更加难以避免。为此,研发人员现在已经建立了多种能够预测光谱和肽特性的深度学习方法,包括但不限于Prosit、DeepMass和DeepDIA,预计此举能够优化DIA方法的预测光谱库,使蛋白质组学领域朝着更好的方向发展。
3、人工智能和非质谱蛋白质组学
人工智能还能够辅助非质谱蛋白质组学的发展,这一领域对于理解以缠结、聚集的蛋白质为特征的病理学(如阿尔茨海默病)是不可或缺的。该领域采用的关键方法包括显微镜和F
相关新闻
◎版权作品,未经今日健康网书面授权,严禁转载,违者将被追究法律责任。
Copyright 2015-2018. 今日健康网 www.jinrijiankang.org All rights reserved.
违法和不良信息举报邮箱:jubao@jinrijiankang.org 执行主编:为民
未经过本站允许,请勿将本站内容传播或复制