AlphaFold2成功以前所未有的准確度預測典型蛋白質的結構

英國《自然》雜誌16日發表的一項結構生物學最新研究,世界著名人工智慧團隊深度思維(DeepMind)描述了神經網絡「阿爾法折疊2」(AlphaFold2),就計算機方法而言,「阿爾法折疊2」能以前所未有的准確度根據蛋白質的胺基酸序列預測其三維結構。

AlphaFold2成功以前所未有的准確度預測典型蛋白質的結構

蛋白質折疊問題被認為是人類在21世紀需要解決的重要科學前沿問題之一。理解蛋白質的結構有助於確定蛋白質的功能,了解各種突變的作用。

截至目前,約有10萬個蛋白質的結構已經用實驗方法得到了解析,但這在已經測序的數10億計蛋白質中只占了很小一部分。在過去50多年的時間里,研究人員一直嘗試根據蛋白質的胺基酸序列預測其折疊而成的三維結構。然而,當前使用的計算方法准確度有限,實驗方法對人力和時間的要求也非常高。

此次,深度思維首席科學家約翰·詹普爾、創始人兼執行長戴米斯·哈薩比斯及其團隊描述了「阿爾法折疊2」——一個基於神經網絡的新模型,其預測的蛋白質結構能達到原子水平的准確度。研究團隊在2020年5月至7月舉辦的第14屆「蛋白質結構預測關鍵評估」(CASP14)大賽中驗證了這種方法。

AlphaFold2成功以前所未有的准確度預測典型蛋白質的結構

CASP14比賽要求參賽團隊根據蛋白質的胺基酸序列解析它們的結構。比賽用的蛋白質會先用實驗方法解析出來,但具體結果不會公開。比賽中,「阿爾法折疊2」預測的大部分結構達到了空前的准確度,不僅與實驗方法不相上下,還遠超解析新蛋白質結構的其他方法。將實驗方法得到的蛋白質結構疊加在「阿爾法折疊2」的結構上,組成蛋白質主鏈骨架的疊加原子之間的距離中位數(95%的覆蓋率)為0.96埃(0.096納米)。成績排第二的方法只能達到2.8埃的准確度。

「阿爾法折疊2」的神經網絡能在幾分鍾內預測出一個典型蛋白質的結構,還能預測較大蛋白質(比如一個含有2180個胺基酸、無同源結構的蛋白質)的結構。該模型能根據每個胺基酸對其預測可靠性進行精確預估,方便研究人員使用其預測結果。

研究團隊認為,這一精準的預測算法可以讓蛋白質結構解析技術跟上基因組革命的發展步伐。

AlphaFold2成功以前所未有的准確度預測典型蛋白質的結構

戴米斯·哈薩比斯則在一份聲明中表示:在CASP14大會上,他們揭曉了一個可以將蛋白質3D結構預測精確到原子水平的全新「阿爾法折疊」系統,他們承諾會分享該方法,並為科學共同體提供廣泛、免費的獲取途徑。而今他們邁出了承諾的第一步——在《自然》期刊上分享「阿爾法折疊」的開原始碼,並發表了系統的完整方法論,以期待看到該方法為科學界啟發出其他新的研究方法。

「阿爾法折疊」第一代的問世,被認為改變了結構生物學和蛋白質研究的未來:實驗學家將能使用精確結構預測來理解不透明的低溫電磁數據;藥物設計者也可藉此迅速釐清新冠病毒等危險病原體中每種蛋白質的結構,從而更快研發出相關藥物。

來源:cnBeta