資源中心分類:人工智慧
Photo by Karolina Grabowska: https://www.pexels.com/photo/person-reading-a-book-4476140/

聽聲辨病,不再是科幻電影才有的情節,過不久聲音將會成為守護你我健康的好幫手。

2022年9月起,多個醫學資訊網站紛紛披露美國國家衛生研究院(NIH)正在資助建立一個人聲訓練資料庫,期望未來人工智慧(AI)能從一個人的聲音中,及早診斷他是否罹患癌症等疾病,以便及早治療。不久後的12月20日,《Oncology Times》(腫瘤學時報)更大篇幅報導後續消息,引起不少關注。

這個名為「Voice as a Biomarker for Health」(聲音做為健康的生物標記)的行動方案,是美國國家衛生研究院剛宣布「Bridge2AI」行動的幾個計劃之一,其目的是開發一個廣泛的人類聲音資料庫,包括健康者及病患的聲音,利用已核准的第一期1400萬美元經費,加速AI技術在生物醫學領域的臨床應用,比如透過人工智慧演算法檢測各種疾病。

南佛羅里達大學、康乃爾大學Weill Cornell 醫學院,以及美國和加拿大的其他10個機構將攜手合作,進行這項備受矚目的計劃,至於法國人工智慧新創公司Owkin,則為這項計劃涉及敏感語言數據的隱私及安全提供技術協助。

大多數人一生中,都會經歷兩次聲音變化,第一次是青春期聲帶變厚且下移到喉嚨所致,第二次則是老化後削弱聲音的結構變化而形成;然而,對某些人來說,當疾病導致生理或心理健康狀況變差時,聲音也會出現轉變,而這也是越來越多醫師把聲音當成另一種檢視疾病生物標記的原因。

根據南佛羅里達大學Morsani醫學院健康之聲中心主任、美國國家衛生研究院「聲音做為健康的生物標記」項目聯合首席研究員Yael Bensoussan博士的說法,聲音分析是一門已經存在幾十年的科學,語言病理學家和聲學工程師可以從語言訊號中擷取聲音特徵,進行令人難以置信的研究,他們無疑是這個領域的專家。

美國范德堡大學耳鼻喉科助理教授Maria Powell表示,說話是個很複雜的生理工程,涉及從肺部、喉嚨、口腔到大腦的協調及運作,其中只要任何一個環節出了問題,都會影響到聲音。

Yael Bensoussan則表示,疾病最常引發的是音高、音量、振幅、節奏等變化,比如帕金森氏症男性患者的音量可能會下降;帕金森氏症、中風或俗稱「漸凍症」的肌萎性脊髓側索硬化症(ALS)患者可能會口齒不清;至於罹患某些疾病的患者,講話節奏或每分鐘講話的字數,則可能變慢或減少。

科學家認為,人工智慧和機器學習演算法在分析語音、言語和呼吸數據方面,已經相當進步,能夠檢測出其他難以診斷的疾病,並評估身心健康。Yael Bensoussan受訪時表示,聲音是研究成本最低的生物標記之一,同時也是讓人工智慧和機器學習演算法成為一種可行且具有成本效益的方法。

Weill Cornell 醫學院生理學和生物物理學教授、同時也是這項計劃語言項目聯合首席研究員Olivier Elemento補充說,利用語言、聲音以及先進的人工智慧演算法,準確診斷某些疾病的潛力,令人難以置信。

她甚至認為,這項研究結果可能會引發一場醫療保健革命,持續的語言監測,可以比目前更早去提醒醫師注意某些情況,比如感染或神經系統疾病。

Yael Bensoussan同意這個說法,因為聲音具有診斷疾病的潛力,最近一項針對喉癌患者的研究顯示,一種自動語音分析工具比喉科醫師更準確標記了這種疾病,但她強調她們的目標並不是超越或取代臨床醫師,而只是從旁提供協助。

以南佛羅里達大學為首的12個執行機構,將開發5個最有希望進行聲音分析的疾病類別,分別是聲音障礙類的喉癌、聲帶麻痺、喉部良性病變;神經和神經退化性疾病類的阿茲海默症、帕金森氏症、中風、肌萎性脊髓側索硬化症;情緒和精神障礙類的憂鬱症、精神分裂症、俗稱躁鬰症的雙極性情感障礙;呼吸系統疾病類的肺炎、慢性阻塞性肺疾;以及兒童聲音和語言障礙類的言語及語言發展遲緩、自閉症。

Yael Bensoussan表示,幾十年來,我們已經知道聲音和言語會隨著不同疾病而變化,但過去需要使用昂貴的麥克風和硬體設備,才能擷取聲音並進行分析。隨著科技進步,智慧型手機、平板電腦、高品質麥克風和錄音筆更加普及,收集聲音變得相當容易。

「你可以穿著睡衣,躺在沙發上,輕輕鬆鬆收集自己的聲音。」美國國家衛生研究院這項計劃的電腦科學家Frank Rudzicz博士說,你不需要非常複雜或昂貴的設備,也不需要很多專業知識;此外,你還可以隨著時間推移收集更多聲音樣本,以便更準確地描述自己的健康狀況。

接下來的4年裡,這個研究團隊將收集2〜3萬個聲音樣本,以及提供這些樣本者的健康數據,建立一個龐大的聲音資料庫,科學家再用來訓練人工智慧及機器學習演算法,歸納出某些特定疾病患者聲音中的獨有特徵。

美國國家生物醫學影像和生物工程研究所數學模組、仿真及分析主任Grace CY Peng博士表示,人工智慧有很多希望,但目前進展仍相當有限,所幸這項計劃已開始進行。

不過她也提醒,這個計劃將會碰到三個需要克服的挑戰,第一個是收集到人工智慧可以理解的數據;第二個是解決人工智慧的倫理問題,包括消除所收集數據中的偏誤和假影像;第三個則是隱私保護問題。

此外,如何維持聲音樣本的多樣性,建置不同種族和民族的聲音樣本配額,確保不管膚色和人種的所有人都能從中受惠,也充滿挑戰。

儘管如此,研究團隊仍持樂觀態度,認為聲音是最容易收集的生物標記,不會對患者造成任何身體風險,並且可以在資源非常匱乏的環境中收集,聲音分析將成為一個很好的工具,可以改善更多人的健康。

若您對本文有任何批評與建議,歡迎點擊填寫意見表

歡迎點擊訂閱電子報,獲得最新文章訊息。