人工智能對于醫療健康領(lǐng)域中的應用已經(jīng)非常廣泛,從應用場(chǎng)景來(lái)看主要分成了虛擬助理、醫學(xué)影像、藥物挖掘、營(yíng)養學(xué)、生物技術(shù)、急救室/醫院管理、健康管理、精神健康、可穿戴設備、風(fēng)險管理和病理學(xué)共11個(gè)領(lǐng)域,我們著(zhù)重分析前8個(gè),這一篇包含虛擬助理、醫學(xué)影像、藥物挖掘和營(yíng)養學(xué)四個(gè)方面。
虛擬助理:人工智能可以診斷疾病
虛擬助理是一個(gè)你身邊的語(yǔ)音助手,交談是與虛擬助理交互的基本模式。你跟助理說(shuō)話(huà),通過(guò)自然語(yǔ)言處理和語(yǔ)義分析之后,語(yǔ)音助理也會(huì )回復你,蘋(píng)果手機上的Siri可能就是大家最熟悉的虛擬助理。而虛擬助理可以根據和用戶(hù)的交談中,能夠智能化地通過(guò)病情描述判斷你生了什么病。
我們把虛擬助理分成兩類(lèi),一類(lèi)是包括Siri等通用型虛擬助理,另一類(lèi)是專(zhuān)注醫療健康類(lèi)的專(zhuān)用虛擬助理。和通用類(lèi)型助理相比,醫療是一個(gè)更垂直,專(zhuān)業(yè)度更高的領(lǐng)域,有很多專(zhuān)業(yè)術(shù)語(yǔ)和專(zhuān)業(yè)技能需要我們去學(xué)習。我們從五個(gè)方面去對比通用類(lèi)和醫健類(lèi)虛擬助理的差別。通用類(lèi)虛擬助理上市時(shí)間早,資本支持度高,數據規模大。而醫健類(lèi)虛擬助理的專(zhuān)業(yè)屬性強、監管風(fēng)險高。虛擬助理是目前較受資本青睞的人工智能醫療健康細分領(lǐng)域,目前在國外用戶(hù)所熟知的醫健虛擬助理是Babylon Health,而國內在虛擬助手上,也有大數醫達和康夫子嶄露頭角。
Babylon Health是一家位于倫敦的初創(chuàng )公司,已完成金額約17.18M英鎊的A輪融資,投資者包括DeepMind Technologies,該公司計劃推出一款類(lèi)似Siri的醫健類(lèi)虛擬助理應用。Babylon在過(guò)去兩年里建立了一個(gè)龐大的醫學(xué)癥狀數據庫,擁有總共36500個(gè)案例的數據庫,在看醫生前利用語(yǔ)音識別來(lái)詢(xún)問(wèn)用戶(hù)一系列問(wèn)題。相比人工全科醫生的診療,這種光速般的癥狀診斷和熱情溫柔的聲音是幫助Babylon Health降低價(jià)格、保持5英鎊月費的最重要方法。
Babylon Health需要經(jīng)過(guò)兩個(gè)階段的建造,第一個(gè)階段有兩個(gè)步驟,第一個(gè)步驟是自然語(yǔ)言處理,也就是聽(tīng)懂患者對癥狀的描述,知道哪里不舒服。然后根據疾病數據庫里面的內容進(jìn)行對比和深度學(xué)習,對患者提供醫療和護理建議。這個(gè)階段局限于腎臟、肝臟、膽固醇和骨科等較小范圍的領(lǐng)域。在第二個(gè)階段,隨著(zhù)更大規模數據庫的加入和更長(cháng)時(shí)間的訓練,Babylon Health將提供更多種類(lèi)的疾病建議。
Babylon Health創(chuàng )始人Ali Parsa認為,每年人工處理病患會(huì )發(fā)生大量誤診死亡事件,有一種說(shuō)法認為美國ICU誤診死亡達40500人/年,而利用人工智能技術(shù),從虛擬助理切入,能夠更準確、更快捷、更安全、更便宜地實(shí)現病患處理。但是,目前在政策法律方面,由于醫療責任主體不明,監管部門(mén)禁止虛擬助理提供輕微疾病的診斷和重癥的任何建議。
目前,監管部門(mén)要求虛擬助理在輕疾方面僅僅能夠提供一些咨詢(xún)和建議,不能提供診斷,在重癥方面只能提議立刻前往醫院或代撥醫院急救電話(huà)。業(yè)內醫師也同樣對該應用產(chǎn)生了質(zhì)疑,因為患者并不完全了解身體所出的狀況,表達的時(shí)候會(huì )漏掉一些關(guān)鍵信息,同時(shí)咨詢(xún)的時(shí)候會(huì )使用大量的非專(zhuān)業(yè)詞匯,虛擬助理可能沒(méi)有辦法去挖掘真正有用的信息作出更準確的判斷。以上是虛擬助理目前的存在的問(wèn)題。雖然如此,虛擬助理的成本更低,有助于控費,人類(lèi)醫生無(wú)法窮盡所有的疾病,而人工智能理論上可以,因此完全可以成為人類(lèi)醫師的得力助手。
醫學(xué)影像:輔助和代替醫生看膠片
醫學(xué)影像與人工智能的結合,是數字醫療領(lǐng)域較新的分支,而且是數字醫療產(chǎn)業(yè)的熱點(diǎn)。醫學(xué)影像包含了海量的數據,即使有經(jīng)驗的醫生有時(shí)也顯得無(wú)所適從。醫學(xué)影像的解讀需要長(cháng)時(shí)間專(zhuān)業(yè)經(jīng)驗的積累,放射科醫生的培養周期相對較長(cháng),而人工智能在對圖像的檢測效率和精度兩個(gè)方面,都可以做得比專(zhuān)業(yè)醫生更快,還可以減少人為操作的誤判率。
近年,從圖像中識別出對象物的“圖像識別技術(shù)”的性能在“深度學(xué)習”的幫助下得以迅速提高。X光照片的分辨率為3000×2000像素。其中的惡性腫瘤的尺寸為3×3像素左右。從非常大的圖像上判斷一個(gè)很小的陰影狀物體是不是惡性腫瘤,是非常難的任務(wù)。首先會(huì )將一張膠片進(jìn)行預處理,然后分割成若干小塊,再在每一塊中提取特征值和數據庫進(jìn)行對比,最后經(jīng)過(guò)匹配后作出陽(yáng)性判斷。在整個(gè)診斷過(guò)程中,人工智能也會(huì )自己做出深度學(xué)習,在病歷庫中尋找案例,做出自己判斷的依據。放射科醫師診斷1名患者的CT掃描圖像需要10~20分鐘,寫(xiě)診斷報告需要10分鐘左右。
在國外,已經(jīng)出現了數家較為知名的初創(chuàng )企業(yè)。表格中的Enlitic就是一家比較知名的人工智能醫學(xué)影像企業(yè),雖然創(chuàng )立于2014年,但次年就被MIT Technology Review評為2015全球最智慧的50家公司之一,獲得總計1500萬(wàn)美元的融資。Butterfly正在研發(fā)一種小型超聲設備,這套系統主要依靠軟件來(lái)運行,包括用人工智能專(zhuān)家開(kāi)發(fā)的技術(shù)來(lái)梳理一系列圖像,從而提煉出可以自動(dòng)進(jìn)行疾病診斷的功能。活躍度全球第一和第三的專(zhuān)注人工智能的風(fēng)險投資機構也紛紛成為智能醫學(xué)影像初創(chuàng )企業(yè)的投資人。
我們對比了中國和美國的醫學(xué)影像現狀,從影像方面的誤診人數來(lái)看,美國每年的誤診人數達到了1200萬(wàn),而中國因為人口基數龐大,達到了驚人的5700萬(wàn)/年,這些誤診主要發(fā)生在基層醫療機構。目前中國的醫學(xué)影像正在從傳統的膠片向電子膠片過(guò)渡,而美國傳統膠片已經(jīng)成為歷史。電子膠片的廣泛使用使得醫學(xué)影像數據大幅度增長(cháng),美國的數據年增長(cháng)率達到了63.1%,在中國也達到了30%。放射科醫生的年增長(cháng)率美國和中國僅僅只有2.2%和4.1%,遠遠低于影像數據的增長(cháng),形成了巨大的缺口。這意味著(zhù)醫師工作量大增,判斷準確性下降,借助人工智能對影像進(jìn)行判斷則能有效彌補該缺口。在國內這個(gè)缺口略小于美國,但我們的特殊國情也使得跨平臺的影像云有巨大市場(chǎng)需求。
Enlitic開(kāi)發(fā)了從X光照片及CT掃描圖像中找出惡性腫瘤的圖像識別軟件,利用深度學(xué)習的方法一“Convolutional Neural Network(ConvNet,卷積神經(jīng)網(wǎng)絡(luò ))”對放射技師檢查過(guò)有無(wú)惡性腫瘤及腫瘤位置等的大量醫療圖像數據進(jìn)行機器學(xué)習,自動(dòng)總結出代表惡性腫瘤形狀等的“特征”以及重視哪些特征能夠判斷有無(wú)惡性腫瘤等“模式”。Enlitic使用肺癌相關(guān)圖像數據庫“LIDC”和“NLST”進(jìn)行了驗證,結果發(fā)現,該公司開(kāi)發(fā)的系統的肺癌檢出精度比一名放射技師檢查肺癌的精度高5成以上。無(wú)論是對患者、放射科醫師還是醫院,人工智能在醫學(xué)影像上的幫助都是巨大的,可幫助患者更快速地完成X光、B超、CT等健康檢查,獲得更準確的診斷建議;幫助醫師更快完成讀片,已經(jīng)更準確的輔助診斷;醫院也可以得到云平臺支持,建立多元數據庫,降低成本。而如果采用Enlitic公司的系統可以使CT掃描圖像的診斷時(shí)間減半,當骨裂面積小到只占到整張X光片0.1%時(shí),也能準確識別出來(lái)。
前面我們分析了人工智能對患者、醫生和醫院所帶來(lái)的好處,在醫學(xué)影像企業(yè)中,人工智能技術(shù)的加入對創(chuàng )業(yè)團隊的核心競爭力也有非常大的影響。根據動(dòng)脈網(wǎng)對醫學(xué)影像初創(chuàng )企業(yè)的走訪(fǎng),擁有人工智能技術(shù),整個(gè)團隊能顯著(zhù)減少人力成本,技術(shù)團隊規模在A(yíng)輪以前可以控制在20人以?xún)龋夹g(shù)人員和非技術(shù)人員的比例達到2.6:1。如果沒(méi)有人工智能技術(shù),那么就要組件一只人力成本不菲的客服團隊和醫師溝通,技術(shù)人員和非技術(shù)人員的比例為1.1:1,規模也達到了30至50人。分級診療和遠程醫療的大背景使中國的醫學(xué)影像創(chuàng )業(yè)團隊更多的投入資源搭建云平臺,但長(cháng)期看能否有人工智能的技術(shù)實(shí)力也是核心競爭力的一部分。
藥物挖掘:大幅度降低藥物研發(fā)成本
藥物的發(fā)現和篩選經(jīng)歷了三個(gè)階段。
第一個(gè)階段是1930年~1960年之間的隨機篩選藥物階段。這是一個(gè)偶然發(fā)現的時(shí)代,隨機篩選藥物的典型代表就是利用細菌培養法從自然資源中篩選抗菌素。
第二個(gè)階段是1970年~2000年,這個(gè)時(shí)代技術(shù)更加先進(jìn),可以使用高吞吐量的靶向篩選大型化學(xué)庫。組合化學(xué)的出現改變了人類(lèi)獲取新化合物的方式,人們可以通過(guò)較少的步驟在短時(shí)間內同時(shí)合成大量化合物,在這樣的背景下高通量篩選的技術(shù)應運而生。高通量篩選技術(shù)可以在短時(shí)間內對大量候選化合物完成篩選,經(jīng)過(guò)發(fā)展,已經(jīng)成為比較成熟的技術(shù),不僅僅應用于對組合化學(xué)庫的化合物篩選,還更多地應用于對現有化合物庫的篩選。如降低膽固醇的他汀類(lèi)藥物,就是這樣被發(fā)現的。
而現在是第三個(gè)階段,虛擬藥物篩選階段,將藥物篩選的過(guò)程在計算機上模擬,對化合物可能的活性作出預測,進(jìn)而對比較有可能成為藥物的化合物進(jìn)行有針對性的實(shí)體體篩選,從而可以極大地減少藥物開(kāi)發(fā)成本。在醫藥領(lǐng)域,最早利用計算機技術(shù)和人工智能并且進(jìn)展較大的就是在藥物挖掘上,如研發(fā)新藥、老藥新用、藥物篩選、預測藥物副作用、藥物跟蹤研究等,均起到了積極作用。這實(shí)際上已經(jīng)產(chǎn)生了一門(mén)新學(xué)科,即藥物臨床研究的計算機仿真(CTS)。
一般估計,一種新藥的開(kāi)發(fā)平均需要10年時(shí)間,耗資15億美元,但隨著(zhù)藥物開(kāi)發(fā)難度的增大目前可能一種新藥會(huì )耗資40億~120億美元,還不能保證成功。新藥研發(fā)除了要求藥品的療效外,還需要保證其安全性,必須經(jīng)過(guò)動(dòng)物實(shí)驗和Ⅰ、Ⅱ、Ⅲ期臨床試驗。而即便Ⅲ期臨床試驗后批準上市,還有Ⅳ期臨床研究,即新藥上市后的再評價(jià)。這也是造成藥物研發(fā)周期長(cháng)、費用高的重要原因。
但是,在今天,有了計算機和人工智能,為人們提供了一個(gè)檢測藥物的人工智能安全專(zhuān)家。首先,在新藥篩選時(shí),可以獲得安全性較高的幾種備選物。當很多種甚至成千上萬(wàn)個(gè)化合物都對某個(gè)疾病顯示出某種療效,但又對它們的安全性難以判斷時(shí),便可以利用人功智能所具有的策略網(wǎng)絡(luò )和評價(jià)網(wǎng)絡(luò )以及蒙特卡洛樹(shù)搜索算法,來(lái)挑選最具有安全性的化合物,作為新藥的最佳備選者。
其次,對于尚未進(jìn)入動(dòng)物實(shí)驗和人體試驗階段的新藥,也可以利用人工智能來(lái)檢測其安全性。因為,每一種藥物作用的靶向蛋白和受體都并不專(zhuān)一,如果作用于非靶向受體和蛋白就會(huì )引起副作用。人工智能可以通過(guò)對既有的近千種已知藥物的副作用進(jìn)行篩選搜索,以判定其是否會(huì )有副作用,或副作用的大與小,由此選擇那些產(chǎn)生副作用幾率最小和實(shí)際產(chǎn)生副作用危害最小的藥物進(jìn)入動(dòng)物實(shí)驗和人體試驗,從而大大增加成功的幾率,節約時(shí)間和成本。
此外,利用人工智能還可模擬和檢測藥物進(jìn)入體內后的吸收、分布、代謝和排泄、給藥劑量-濃度-效應之間的關(guān)系等,讓藥物研發(fā)進(jìn)入快車(chē)道。
目前人工智能藥物挖掘主要在三大領(lǐng)域:抗腫瘤藥、心血管藥和孤兒藥及經(jīng)濟欠發(fā)達地區常見(jiàn)傳染病藥。抗腫瘤藥和心血管藥的共同特點(diǎn)就是市場(chǎng)規模大、增速快,2015年的銷(xiāo)售金額都超過(guò)了1000億美元。利用人工智能對藥物進(jìn)行挖掘,可以顯著(zhù)降低成本和開(kāi)發(fā)難度。而第三種類(lèi)別的藥物孤兒藥與經(jīng)濟欠發(fā)達地區常見(jiàn)傳染病防治藥,因為市場(chǎng)價(jià)值低,藥企的收益不足以覆蓋其研發(fā)成本,企業(yè)積極性不大。那么利用人工智能可以節約成本,為罕見(jiàn)病患者和經(jīng)濟欠發(fā)達地區的傳染病患者提供藥物。
前面我們列出了6家結合人工智能與藥物挖掘的初創(chuàng )公司,按照融資額度排列,Numerate以1750萬(wàn)美元排在第一位,而Atomwise是其中比較有代表性的初創(chuàng )公司。Atomwise公司用超級計算機分析已有數據庫,并用AI和復雜的算法來(lái)模擬藥品研發(fā)的過(guò)程,在研發(fā)的早期評估新藥研發(fā)風(fēng)險,讓藥物研究的成本降至數千美元,并且該評估可以在幾天內完成。Atomwise軟件平臺運行在IBM的藍色基因超級計算機上,其強大的計算能力使得他們可以完成很多任務(wù),例如評估820萬(wàn)種化合物,并且在幾天之內找到多發(fā)性硬化癥可能的治療方法。2015年,公司宣布在尋找埃博拉病毒治療方案方面有一些進(jìn)展,即在 Atomwise 預測的藥物中,有兩種或許能用來(lái)抗擊埃博拉病毒,他們用時(shí)一個(gè)星期就找到了這種藥物,并且成本不超過(guò) 1000 美元。
Atomwise還為制藥公司、創(chuàng )業(yè)公司和研究機構提供候選藥物預測服務(wù)。Atomwise的服務(wù)可以預測哪些新藥品真的有效,哪些無(wú)效。該公司稱(chēng)自己在新藥發(fā)現、結合親和力預測和毒性檢測上得到了世界上最好的結果。在合作伙伴方面,Atomwise除了與Merck公司和Autodesk進(jìn)行一些保密項目外,公司也持續與學(xué)術(shù)界和企業(yè)客戶(hù)開(kāi)展研究工作,通過(guò)輔助制藥企業(yè)、生物科技公司和其他相關(guān)研究機構開(kāi)展藥物挖掘工作獲取收入。
到目前為止,Atomwise總共獲得了657萬(wàn)美元的投資,他的成功除了在人工智能領(lǐng)域的獨特算法和專(zhuān)業(yè)人才之外,還有好的孵化器和VC投資者。知名早期創(chuàng )業(yè)公司孵化器Y Combinator 和風(fēng)險投資公司khosla ventures提供了海量的數據資源,并幫助其對接其他醫療機構。為了避免FDA New Drug Application對人工智能輔助藥物挖掘的監管風(fēng)險,Atomwise主動(dòng)參與開(kāi)發(fā)防治埃博拉的藥物,并參與公益項目樹(shù)立良好的公共形象。
營(yíng)養學(xué):告訴我們應該吃什么
David Zeevi團隊2015年11月在《Cell》發(fā)表論文,闡釋了機器學(xué)習應用于營(yíng)養學(xué)的積極作用。研究者分析了三組不同的數據,其中第一組數據來(lái)自800名志愿者。他們每天第一頓食用四套標準化食品中的一種,其余時(shí)間正常飲食。研究者采集了他們的血樣、糞便,以血糖數據、腸道菌群等多項數據,并使用調查問(wèn)卷、App等形式收集食物、鍛煉以及睡眠數據。數據收集持續一周。
通過(guò)分析標準化飲食的結果,研究者發(fā)現即便食用同樣的食品,不同人的反應依然存在巨大差異。這表明,過(guò)去通過(guò)經(jīng)驗得出的“推薦營(yíng)養攝入”從根本上就有“漏洞”。接下來(lái),研究者開(kāi)發(fā)了一套“機器學(xué)習”算法,分析學(xué)習血樣、腸道菌群特征與餐后血糖水平之間的關(guān)聯(lián),并嘗試用標準化食品進(jìn)行血糖預測。葡萄糖是人類(lèi)細胞最主要的能量來(lái)源,血糖異常會(huì )導致多項重要疾病。可以說(shuō),血糖管理是精準營(yíng)養的基石。
機器學(xué)習算法被800名志愿者的數據“訓練”之后,變得能夠預測食物對人體血糖水平的影響。隨后,研究者在第二組人群上(100個(gè)志愿者)驗證機器學(xué)習得出的預測模型,效果非常理想。
那么機器學(xué)習得出的模型能否實(shí)際運用于指導健康飲食呢?研究者在第三組人群上(26個(gè)志愿者)進(jìn)行雙盲試驗。研究者對每位志愿者的血樣、微生物組數據、人體測量學(xué)制訂了個(gè)性化膳食計劃。其中一組12名自愿者,使用機器學(xué)習算法的建議;對照組14名自愿者,采用醫生和營(yíng)養專(zhuān)家的建議。膳食計劃也分為兩種,一種被設計用于控制血糖水平,另一種則相反。每組志愿者均嚴格遵照建議飲食兩周,一周進(jìn)行“健康飲食”另一周踐行“不健康飲食”,并比較結果。
最終的研究結果表明,機器學(xué)習算法給出了更精準的營(yíng)養學(xué)建議,成功控制餐后血糖水平,結果優(yōu)于傳統專(zhuān)家建議!這為機器學(xué)習以及精準營(yíng)養學(xué)打開(kāi)了一扇大門(mén),同時(shí)這篇重磅論文也登上了當期《Cell》雜志的封面。
目前較知名的將人工智能應用于營(yíng)養學(xué)的初創(chuàng )公司為位于都柏林的Nuritas。Nuritas通過(guò)新開(kāi)發(fā)的人工智能與分子生物學(xué)相結合的新技術(shù)在食品領(lǐng)域引起了巨大的爭議。Nuritas通過(guò)建立食品數據庫識別肽(食品類(lèi)產(chǎn)品中的某些分子)可以作為食物的補充或新的成分。這種識別不只是添加蛋白粉搖一搖。相反,Nuritas是識別可以使食物根據身體反應不同而生成不同的肽。例如,其聯(lián)合創(chuàng )始人Dr. Nora Khaldi接受采訪(fǎng)時(shí)就表示,公司發(fā)現某種谷物可以用于控制2型糖尿病或抗衰老成分。
Nuritas 目前的收入來(lái)自B端。傳統的食品制造商主要關(guān)注成本控制與安全,并不擅長(cháng)識別食品中有利人體健康的肽。Nuritas為食品制造企業(yè)提供數據挖掘服務(wù)(采用了機器學(xué)習),并按銷(xiāo)量收取傭金。未來(lái)計劃推出面向消費者to C的個(gè)性化營(yíng)養方案,針對每位消費者的情況制定不同的方案,收取服務(wù)費。
在我國,進(jìn)入小康社會(huì )之后,人們的生活水平大幅度上升,上層中產(chǎn)階級的數量從2002年的330萬(wàn)上升到2012年的3584萬(wàn),大眾中產(chǎn)階級從1155萬(wàn)上升到1.38億。這些人群對食品的營(yíng)養有更高的要求,不僅僅是為了吃飽,而是為了身體健康能夠吃好。合理的膳食搭配以及更安全的有機食品需求成為新的食品產(chǎn)業(yè)增長(cháng)點(diǎn),急需新技術(shù)推動(dòng)行業(yè)變革。
中國的餐飲和西餐有較大的區別,中餐難以標準化,即使是同一道菜不同師傅教出來(lái)的做法也不盡相同。同時(shí),菜品搭配不同和烹飪手段不同導致菜品多樣化,數據不全,無(wú)法做到量身定制營(yíng)養套餐。
那么我們國內的人工智能+營(yíng)養學(xué)初創(chuàng )公司應該如何為客戶(hù)進(jìn)行服務(wù)呢?我們建議有兩種模式,主要針對C端用戶(hù)。模式一是針對個(gè)人用戶(hù)進(jìn)行個(gè)性化營(yíng)養建議,收取服務(wù)費。模式二是to C和to B同時(shí)服務(wù),并推廣中餐營(yíng)養標準化。