Alphafold 不能取代结构生物学家!
刚决定离美归国不久的颜宁,再度发声。
事实上自她宣布“归去来兮”后,喧嚣与争议都没停过。
这其中最匪夷所思的,就是关于回来原因的讨论 —— 工作被 AI 替代了,所以在美国混不下去了。
于是在深圳“忙到现在”的颜宁,终于给出回应:
Alphafold 仍停留在我们 5 年前水平,与 AI 团队合作迄今预测无一正确。
还罗列出了各种目前 AI 在结构生物学还无能为力的方面。
不少网友表示:不懂这行,但听到颜老师这么说,就放心了。
“Alphafold 仍停留在我们 5 年前水平”
颜宁离美归国创办深圳医学科学院,是在 11 月 1 日官宣的,一时备受关注,圈内圈外不少人都表达了夸赞和期待。
但一些质疑声也随之而来。
个中话题,涉及其私人经历,人事变动,甚至论文引用规范…… 最为引人关注的,还是 —— 这位科学家之所以回国,因其研究方向已被 AI 取代。
对此,颜宁的回应可以概括为三个方面。
其一,自己没被 AI 取代,还远着呢;其二,AlphaFold 专注于折叠,但对结构生物学领域,有三大理解问题,AI 无能为力;其三,作为科研工作者,当然乐于拥抱技术进步。
具体来说。
颜宁所专注的电压门控钠离子和钙离子通道有几个关键问题(electromechanical coupling, ion selection, MOA of drugs and toxins),AlphaFold 在我们过去解析的诸多结构的基础上,于 2021 年预测结果达到了他们 2017 年的水平;
但一年过去,AlphaFold 依旧停留在 5 年前(这里仅针对 Nav / Cav)。
为证明这点,她还摆出自己 2021 年 8 月及今年 11 月的两次「AlphaFold 局限性」主题报告 PPT 封面,称自己除日期外,内容一字也无需改。
此外,她还拿自己的亲身经历作为补充,本来已与专门做结构预测的 AI 团队合作,测试新型小分子与蛋白的相互作用。但迄今为止预测无一正确。
接着,科普博主颜宁从专业的角度探讨了 AlphaFold 与结构生物学之间的关系。
一言以蔽之,AlphaFold 属于蛋白质预测模型,专注于折叠,但对结构生物学来说,在折叠之外,有三大理解问题,AI 无能为力。
理解蛋白质的动态变化
理解与其他生物大分子或者调节小分子的相互作用
理解在细胞原位里的状态。
目前上述领域缺乏足够数据对 AI 进行训练,因此模型无法对其提供正确预测。
一个典型的例子,就是去年他们团队发表了 Cav2.2 结构的成果。这是一种神经组织 N 型电压门控钙离子通道,与人体痛觉传导有关。解析其结构有助于了解通道调控机理,也为相关止痛药设计研发提供思路。
因为发表晚了一步,没有放到数据库给到 AlphaFold 训练。于是经由它预测出来的结构,就与实验结果严重不符。
最后,颜宁还谈了谈对 AlphaFold 这些新技术的态度。
她表示:
真正的研究者都乐于拥抱技术进步,善用各种技术去探寻、解答自己感兴趣的问题。事实上,我期待 AI 越来越强大,如果它真的可以强大到把我上述提的三个理解都实现,那我们真可以正儿八经从化学角度研究生命起源了。
AlphaFold 以及 AI 究竟能否取代计算生物学?颜宁此次发声无疑是给下明确的回答。事实上,自 Alphafold 诞生之日起,这种争议就一直存在。
AlphaFold 能做什么
蛋白质结构预测,这是大家对于 AlphaFold 第一印象。一年时间它能从成功预测人类 92.5% 蛋白质,到全球已知所有的蛋白质结构都能预测。
如此速度和精确度,不免让人担心它会替代一批生物学家,正如当年 AlphaGo 一样。首当其冲就是结构生物学家,其研究涉及生物大分子的三级结构(包括构架和形态),如何获得他们的结构以及结构如何影响功能。
于是网络上就有相关问题的讨论:像施一公颜宁、David Baker 这些致力于该领域的科学家会不会深受打击,甚至因此失业?
但事实是,蛋白质结构预测只是结构生物学的一个分支,也算不上一个新学科。在 AlphaFold 出现之前,就已经有科学家就已经尝试用算法通过序列来预测三维结构。
更严格意义上来讲,只是其中一种工具之一。
以往常用的实验手段包括,质谱法、X 射线晶体学、冷冻电镜等,他们解析出来的分辨率高、错误率低。尤其是冷冻电镜的发明,直接让解析结果上升到了新高度。但碍于成本高昂,依赖设备,于是就有科学家另辟蹊径,来做结构预测。
据颜宁早前采访时表示,蛋白质结构预测与实验结构生物学融合度越来越高。在冷冻电镜时代,用软件预测结构模型,再根据实验数据调整,就已经是常规操作。
其实也就是当下热议的干湿实验闭环 —— 计算生物在科研领域的典型价值。
颜宁曾这样定义结构生物学:它的主语是生物学,是理解生命、是做出生物学发现。
结构只是开始,生物学功能、机理才是终点。而且光结构解析这一项,也需要多个手段联合协作。
最典型如施一公团队的 RNA 剪接体机理研究。他们曾在 Science 封面连发两篇背靠背文章。
团队首先通过冷冻电镜解析了酵母剪接体近原子分辨率的三维结构。接着就是在这个结构基础上进行质谱等手段去详细分析,最终揭示了剪接体对前体信使 RNA 执行剪接的基本工作机理。
放在当时在学界属于首次,为与剪接体相关疾病的发病机理奠定了基础。
如果将结构当做分析机理的手段,那么 AlphaFold 更是生物学发现的起点。
除了蛋白质结构,事实上在结构生物学领域还有更多的问题还没有解决,比如动力学问题,蛋白质折叠的中间态等,依然是现有实验手段无法揭示的。
网友:多喝凉茶不要上火
此番回应之下,一方面解释了关于「研究方向被 AI 取代」的质疑,另一方面也从中理解了此次颜宁回国的价值和意义。
有网友表示:
综上预测软件基于大数据的数学和概率 ,同样的电镜等设备上的软件也是基于测算物理的光的数据自动绘制出来的 。
回忆一下初中物理和大学数学的知识,分析一下二者不同和相同,你就能判断颜宁这件事是怎么回事以及她做的事情的意义。
而对于这一波直率而幽默的回应,网友表示:这脾气爱了爱了。
既讲明白了问题,还暗戳戳针对了一些人。
当然,还有网友建议:既然到了广东,多喝凉茶,不要上火。
嗯,确实很贴心了。
参考链接:
[1]https://weibo.com/1656918431/Mes5tanma?type=repost#_rnd1668230651180
[2]https://zhuanlan.zhihu.com/p/330067710
[3]https://www.theregister.com/2022/09/08/deepmind_alphafold_performance/
本文来自微信公众号:量子位 (ID:QbitAI),作者:杨净 詹士