人体含有至少2万种不同的蛋白质,由于它们在保持细胞健康方面的作用,通常被称为“细胞的主力”。每一种蛋白质都由一串独特的氨基酸组成,这些氨基酸会影响蛋白质的形状和功能,如果蛋白质组装不正确,就会导致疾病。
通过了解和预测蛋白质可能呈现的大量形状,科学家可以设计针对细胞中具有特定作用的特定蛋白质的药物。人们希望像谷歌的alphafold这样的技术——利用人工智能(AI)来预测蛋白质、DNA和其他生物分子的结构——将加速这项艰巨的任务,并随后开发出可能挽救生命的药物。
马里兰大学的研究人员对这一雄心勃勃的目标持“谨慎乐观”态度,但他们表示,AlphaFold必须与更强大的物理基础相结合,才能取得成功。发表在《eLife》杂志上的一篇新论文描述了他们开发的一种方法,正是这样做的。
该研究的资深作者Pratyush Tiwary说:“有很多未治愈的疾病,我们希望人工智能可以帮助我们筛选大量化合物,以经济高效的方式识别有效、无毒的药物,最终降低所有人的医疗成本。”“我们的方法将加速药物发现,并为复杂疾病提供个性化医疗。”
Tiwary是马里兰大学帕克学院化学与生物化学系、物理科学与技术研究所(IPST)和马里兰大学健康计算研究所(UM-IHC)的教授。
他们的方法,AlphaFold2-RAVE (AF2RAVE),将AlphaFold的优势与基于物理定律的计算机模拟相结合。它扩展了Tiwary和他的学生在2018年设计的一项名为RAVE的早期技术,以加快通常需要很长时间处理的分子模拟。
AlphaFold擅长预测蛋白质在“天然”或折叠状态下的结构,但它无法预测非天然状态下的蛋白质。就像折纸一样,蛋白质可以折叠成不同的形状,这些折叠会影响蛋白质执行任务的能力。
在非天然形式下,蛋白质可以展开或错误折叠,这限制了它们的功能,甚至可能导致阿尔茨海默氏症和帕金森氏症等疾病。这些非原生形状难以预测,但对新药的开发仍然至关重要。
Tiwary解释说,AlphaFold忽略了非天然结构,因为它依赖于储存在蛋白质数据库中的信息,该数据库主要包含天然状态下的蛋白质结构。
“AlphaFold所做的——这是一个突破——是预测蛋白质可以采取的最稳定的结构,”Tiwary说,他也是UMD化学物理学的米勒德和李亚历山大教授。“它无法预测蛋白质可以采取的其他结构。这是人工智能的一个根本问题——不仅在化学领域,在所有学科领域都是如此——因为人工智能的方法只能和它们的训练数据库一样好。”
为了克服这个问题,Tiwary和他的合作者将他们的RAVE方法应用于AlphaFold 2,这是谷歌在2024年5月发布AlphaFold 3之前的最新版本。
Tiwary解释说:“我们的方法首先使用AlphaFold 2生成数千种可能的假设或蛋白质结构,类似于反复询问ChatGPT等人工智能工具以获取答案。”“然后通过基于物理定律,特别是热力学和统计力学的高分辨率计算机模拟来评估这些假设的结构。”
他们用他们的方法生成了三种激酶的可能的天然和非天然结构,这是一种在细胞生长中起重要作用的蛋白质。异常的激酶活性可能导致癌症的发展,这部分解释了为什么激酶是第二重要的药物靶点——仅次于G蛋白偶联受体,一个具有多种功能的蛋白质家族。
首先,研究人员能够预测激酶可能采用的3D结构,并对它们进行热力学排序,最终揭示出候选药物可能结合的1000种非天然结构中的前两种。热力学与药物设计相关,因为它决定了特定蛋白质形状在自然界中出现的可能性,以及药物与蛋白质结合的成功程度,从而提高其有效性。
“这个评估决定了在室温和压力下形成每种结构的可能性,”Tiwary说。“结果,数千种最初的假设被过滤成一组更容易管理、更可能的结构。”
他们的方法可以减少对药物对接的需求,药物对接是一种计算方法,用于确定药物分子如何与特定蛋白质结合。Tiwary说,当研究人员将AF2RAVE的候选药物列表与已知针对特定激酶形状的现有药物进行比较时,研究人员发现,他们的结果匹配率超过50%——如果没有这种方法,成功率是不可能达到的。
“当单独使用AlphaFold时,成功率几乎是不存在的,”Tiwary说。“如果没有我们的方法,你将不得不将药物与AlphaFold 2生成的1000个结构中的每一个进行对接。对一些激酶来说,1000种中有1种是好的候选药物,但对另一些激酶来说,1000种中没有一种是合适的。”
虽然研究人员只将他们的方法应用于AlphaFold 2,但Tiwary解释说,最新版本的AlphaFold并没有解决以前的非天然蛋白质结构问题。
通过将人工智能与物理学相结合,AF2RAVE方法可以通过识别针对患者独特基因图谱量身定制的药物,从而开创个性化治疗的新时代。它还可能导致与非天然蛋白质结合的新药,这种药物的开发难度更大。
这个发现仅仅是Tiwary和他的同事们用他们的AF2RAVE方法完成的事情的开始。
“这项研究——以及我们下一步要做的——代表了UM-IHC和IPST的最佳成果,”领导UM-IHC治疗靶点发现研究中心的Tiwary说。“这是具有实际意义的严格科学计算,所有这些都以统计力学为基础,IPST在过去几十年中一直处于领先地位。”这个十字路口是一个令人难以置信的令人兴奋的地方!”
Tiwary正与UM-IHC联合执行主任Bradley Maron和生物科学与生物技术研究所的David Weber合作,将AF2RAVE应用于高血压和阿尔茨海默病,希望找到更好的治疗方法。
马里兰大学医学院的医学教授马龙说:“通过使用人工智能来预测多种蛋白质结构,这种革命性的AF2RAVE方法有可能通过识别确定蛋白质功能对支撑疾病的细胞机制的影响的新靶点来加速药物创新。”“我们正处于一个新时代的边缘,将迎来针对这些复杂蛋白质折叠过程的治疗方法。”
此外,Tiwary和他的团队正在与国家癌症研究所的研究人员Gregoire Altan-Bonnet、Naomi Taylor和John Schneekloth合作,将这些方法应用于儿科免疫治疗和癌症。
在这些项目和未来的项目中,Tiwary认为AI可以伦理地应用于生物物理和生物化学领域,以改善人们的生活。
蒂瓦里说:“人工智能,尤其是在物理学的指导下,将会继续存在。”“AF2RAVE不仅仅是另一种方法,它将对人们的日常生活产生影响。”
点击分享到









