將蛋白質組大數據與人工智能相結合,致力于開發基于蛋白質組和其他分子組學的輔助臨床診斷新方法,以期實現腫瘤等人類重大疾病的精準輔助診斷……由西湖大學郭天南實驗室提供核心技術,近日,西湖歐米(杭州)生物科技有限公司獲得數千萬元種子輪融資。
據了解,西湖歐米有望實現臨床轉化的首個項目,是基于蛋白質標志物的甲狀腺結節的良惡性診斷。
西湖大學生命科學學院特聘研究員郭天南介紹道,蛋白質組學是繼基因組學、轉錄組學后人類對生命活動奧秘探究的又一突破。人類的幾乎所有生命活動都是由人體內的蛋白質執行的,疾病治療的效果也取決于蛋白質機器的調控。蛋白質組學+AI技術的運用場景,將遠不止于甲狀腺結節。
為蛋白質稱重 捕捉細微變化
人們在吞咽的時候,頸部隨著吞咽動作上下活動的器官即甲狀腺。甲狀腺雖小,一發生病變或將形成甲狀腺結節,導致頸部有腫物、疼痛以及甲狀腺功能減退癥。
早在2010年,中華醫學會內分泌學分會曾公布中國首次十城市社區居民的甲狀腺疾病流行病學調查結果,顯示居民甲狀腺結節患病率為18.6%。
“按此估測,如今每5個成年人中就可能有1人患有甲狀腺結節。”郭天南介紹,相關臨床調查顯示,約有60%的甲狀腺結節呈良性,10%呈惡性,剩下約30%,無論通過血液檢測、B超、CT還是甲狀腺組織穿刺活檢,均難以辨別良性還是惡性。
“治療甲狀腺結節,很多人不得不選擇切除甲狀腺,代價是終身服藥補充甲狀腺素,以維持體內的甲狀腺激素在正常水平。但其中相當一部分人,患有的實際上為良性結節。”郭天南表示,科學家們曾寄希望于基因檢測,來解決這一難題,但經過十幾年的嘗試發現,基因診斷能夠達到的特異性也僅在10%~50%左右,主要是因為甲狀腺結節惡性程度低等原因,基因水平上的改變并不頻繁、也不明顯。
據介紹,一個人從生到死,從健康到疾病,絕大多數情況下基因都是不變的。但在不同健康狀態下,人體內的蛋白質會發生變化。郭天南實驗室選擇從“蛋白質”入手,開展診斷疾病的技術研究。難點在于,這種變化非常細微,怎么才能檢測到?
郭天南說,所有的蛋白質,即使肉眼能看到,因其復雜的結構也很難準確辨識。“我們通過測量它的重量,來鑒定、區分不同的蛋白質。蛋白質稱重的這桿‘秤’叫質譜儀,我們使用的質譜儀可以達到約小數點后30位(kg)的精度。”
“將蛋白質稱重是第一步,還不足以實現對甲狀腺結節的良惡性辨別。兩種蛋白質的差別是由質譜數據中眾多因素的復雜關系所決定的,是一個模式識別問題。”西湖大學工學院李子青教授強調。
研究團隊構建算法模型將2622個蛋白質組學數據進行了約2的1019次方的運算,再將篩選的20個關鍵蛋白進行良惡性的打分。受訪者供圖
設置算法評分 準確率達89%
在西湖大學工學院李子青教授看來,從甲狀腺結節質譜大數據中鑒別其良惡性,就像從一張圖像中辨識 “兩張”長像類似的人臉。
他帶領研究團隊采用機器學習的方法,從原始質譜數據中選擇出2622個有意義的候選特征蛋白質,并通過神經網絡技術構建了一套適用于蛋白質組學數據的獨特算法模型,將2622個蛋白質組學數據輸入了這個模型,進行了大約2的1019次方的運算,終于找出了能夠幫助醫生辨別患者結節良惡性的20個關鍵蛋白。
李子青介紹,用這套模型,研究人員給這20個蛋白的總體情況打分(分值在0-1之間):當綜合得分大于等于0.5,即為惡性結節;小于0.5,就是良性結節。臨床試驗顯示,這種檢測方法的綜合準確率達到了89%。
“這項技術還可以用來篩選治療腫瘤的藥物。”郭天南說,電影《我不是藥神》提到白血病中有一類叫慢性髓系白血病,幾乎90%的這類患者體內都會出現一個特殊的融合蛋白BCR-ABL,科學家找到“伊馬替尼”這種藥,可以有效抑制這個融合蛋白的功能,有效率可以達到90%以上。
責任編輯:Rex_08