今年2月,《自然》封面報道了用人工智能診斷皮膚癌的重磅研究,彰顯了人工智能在疾病診斷上的無限潛力。
近期,谷歌(Google)的博客上刊登了一篇文章,介紹了谷歌在人工智能與機器學習領(lǐng)域取得的最新進展。在這篇文章中,谷歌與DeepMind以及瑞士巴塞爾大學(University of Basel)一同做出了突破——利用機器學習的方法,他們能準確預測分子的性質(zhì)!這對于藥物發(fā)現(xiàn)來說,有著重要的里程碑意義。
人工智能在疾病診斷上的無限潛力
新的化學分子預示著新的無限可能,因此尋找新分子一直是化學研究中令人激動的一環(huán)。在歷史上,化學家們往往使用薛定諤方程的數(shù)值近似來做計算化學上的研究,其中就包括了一種叫做“密度泛函理論”的量子力學方法。這種方法在化學上有重要價值——它能分析預測分子的性質(zhì),因此有著廣泛的應(yīng)用價值。然而,這一方法對計算能力的要求很高,因此每次進行研究分析的計算量有限,這也在一定程度上限制了它的應(yīng)用。如果能找到一種全新、準確、而又快速的分子性質(zhì)預測方法,無疑將為整個領(lǐng)域帶來突破。
來自谷歌的科學家們想到了近年來火熱的人工智能。先前,他們發(fā)現(xiàn),人工智能在病理診斷上展現(xiàn)出了遠超人類的能力——在乳腺癌的診斷中,專業(yè)的病理學家花了30個小時做的病理分析,竟不如一款人工智能準確。此外,人們也發(fā)現(xiàn),人工智能診斷皮膚癌的準確度也要高于皮膚科醫(yī)生。同理,人工智能方法也許能大幅提高化學發(fā)現(xiàn)的準確度與效率,為該領(lǐng)域帶來改變。
為了驗證這一想法,研究人員首先開發(fā)了多款基于機器學習的方法,并從數(shù)據(jù)庫中提取出了超過10萬種化學分子,供這些方法學習。后續(xù)的檢驗表明,經(jīng)過深度學習后,這些機器學習方法的近似誤差接近“密度泛函理論”,其中神經(jīng)網(wǎng)絡(luò)(neural network)與核嶺回歸(kernel ridge regression)兩類方法的表現(xiàn)尤佳。概念性的驗證無疑給研究人員打了一劑強心針,也讓他們決定繼續(xù)進行深入研究。
在后續(xù)工作中,研究人員選擇了深度的神經(jīng)網(wǎng)絡(luò)作為突破口。神經(jīng)網(wǎng)絡(luò)在識別圖像相關(guān)的數(shù)據(jù)上,已經(jīng)展現(xiàn)出了獨有的優(yōu)勢,這一點對化學分子的性質(zhì)預測而言格外有利。人們能將分子結(jié)構(gòu)簡化為圖像,用點來代替原子,用線來代替化學鍵。這樣一來,神經(jīng)網(wǎng)絡(luò)就能直接讀取這些分子的結(jié)構(gòu),并學習它們的性質(zhì)。先前,不少研究已經(jīng)催生了一些類似的神經(jīng)網(wǎng)絡(luò)工具,而谷歌的研究人員則進一步將它們進行了調(diào)整與整合,將它們合并成一個叫做“信息傳遞神經(jīng)網(wǎng)絡(luò)”(Message Passing Neural Networks,縮寫MPNN)的框架。研究人員們相信,這款神經(jīng)網(wǎng)絡(luò)能有效地預測分子的性質(zhì)。
他們拿了業(yè)內(nèi)的標準來作為檢測的依據(jù)。在主要的13種化學性質(zhì)中,這款神經(jīng)網(wǎng)絡(luò)能準確地預測其中的11種性質(zhì),這足以為化學家們提供有用的信息。更關(guān)鍵的是,它比常規(guī)的“密度泛函理論”要快上30萬倍!
研究人員相信,能夠?qū)瘜W分子的性質(zhì)進行預測,將在化學領(lǐng)域、藥物發(fā)現(xiàn)領(lǐng)域的應(yīng)用中釋放巨大潛力。最終,這些預測結(jié)果將助力人們設(shè)計并開發(fā)出新的藥物,造福人類。
|
|
|
官網(wǎng):www.baichuan365.com |
微信服務(wù)號:iseebio |
微博:seebiobiotech |
|
|
|
商城:mall.seebio.cn |
微信訂閱號:seebiotech |
泉養(yǎng)堂:www.canmedo.com |