資源中心分類:人工智慧
文章標籤:
攝影師:Alex Knight: https://www.pexels.com/zh-tw/photo/2599244/

2023年2月9日一篇發表在《PLOS Digital Health》期刊的研究論文指稱,聊天機器人ChatGPT幾乎可以通過美國醫師執照考試,立即從美國、芬蘭、紐西蘭、中國到印度的全球各大社群媒體引爆話題,不少人不禁要問;人工智慧機器人真的要取代醫師了嗎?

ChatGPT是OpenAI公司開發的一款聊天機器人,不僅能夠以更貼近一般人的對話方式和使用者聊天,還能填詞譜曲、創作劇本和小說,甚至撰寫研究論文。2022年11月推出後,立即在網路爆紅,短短不到三個月,註冊使用人數已激增到1000萬人以上,使用次數更突破1億大關,成為史上成長速度最快的社群媒體。

雖然追捧者絡繹不絕,ChatGPT卻也引起一些道德爭議,主要是這款聊天機器人從科學到教育等領域,幾乎可創造出任何可能,使用者和一般人的公平性出現不對稱傾斜,美國紐約的學校因而限制學生使用它來寫論文,《Nature》等全球頂尖期刊也紛紛禁止透過ChatGPT撰寫的學術研究書面內容,逼得OpenAI公司不得不緊急應對,試圖降溫,但成效有限。

如今,ChatGPT幾乎可以通過美國醫師執照考試消息曝光後,話題延燒到醫界,勢必引發另一波討論風潮,再度炒熱話題。

《PLOS Digital Health》2月9日刊登的這篇研究論文,Tiffany Kung、Victor Tseng以及Ansible Health公司的人員是主要作者,他們測試ChatGPT模擬參加美國醫師執照考試(United States Medical Licensing Examination,USMLE)的表現。

USMLE的對象分為三個級別,一是完成大約300小時學習的二年級醫學生,二是進行大約兩年臨床輪換的四年級醫學生,第三則是完成超過半年研究教育學習的實習醫師,考試內容從生物化學到診斷推理,再到生物倫理學等面向,還包括X光等醫學影像、皮膚科目視鑑別及醫學倫理等,涵蓋大多數醫學知識。

研究人員篩選去除有關圖像的問題後,從2022年6月USMLE發布的376個公共問題中,選取350個來測試ChatGPT。刪除不確定的答案後,ChatGPT在三個級別測試的分數,介於52.4%到75%之間,USMLE每年的及格門檻約在60%上下;換句話說,這款聊天機器人幾乎可以通過美國醫師執照考試,如果不考慮現行法規,它其實有機會成為一名合格醫師。

除了考得不錯外,ChatGPT還展現出94.6%的回覆一致性,並為其中88.9%的回答提出至少一個重要的見解,顯示它是經過深思熟慮才應答的。而另一個值得注意的是,ChatGPT的性能超越了PubMedGPT這款專門針對生物醫學文獻進行訓練的人工智慧對應模型,後者在較舊USMLE測試的分數是50.8%。

研究人員因而表示,在沒有任何人工加強的情況下,ChatGPT能夠達到以困難著稱的美國醫師執照考試及格分數,寫下臨床AI已逐漸成熟的里程碑。對此,各界有不同看法。

NVIDIA執行長黃仁勳日前在加州大學柏克萊分校哈斯商學院演講時表示, ChatGPT本質上讓電腦運算民主化、是人工智慧、軟體業有史以來最偉大的一刻,也是人工智慧的「iPhone 時刻」。

Aligned AI聯合創辦人兼首席研究員Staurt Armstrong博士也表示,這是個令人印象深刻的表現,讓我們不禁期待未來在人工智慧領域可以看到更多成功典範。不過他也提醒,美國醫師執照考試的難易程度, 是針對人類而不是針對機器設計的,難以據此區分高下。

他強調,在雜亂的空間中移動,或是在解析社交資訊的人際互動等領域,人類的表現還是比AI優異,只不過這種優勢不可能永遠持續下去,總有一天AI在每個領域都可能做得比人類好。

國際工程與技術學會(IET)生物醫學工程師兼執行主席Peter Bannister教授認為,ChatGPT在許多邏輯性內容所展現的能力,雖讓人印象深刻,卻也凸顯出筆試的侷限性。儘管筆試是目前評估醫學這類複雜且多學科專業表現的唯一方法,但醫療照護不應只看考試成績,還要有更多考量。

紐西蘭Massey大學科學傳播及播客(Podcast)高級講師Collin Bjork則認為,聲稱ChatGPT可以通過美國醫師執照考試的說法,有點言過其實,其間可能還摻雜一些商業利益。他說,2022年底OpenAI發布這款聊天機器人開放免費試用版本,進而在全球掀起媒體熱潮後,這家公司預估2024年的收入將來到10億美元的新高紀錄。

他不免惴測,這次研究人員透過論文發表宣稱ChatGPT可以通過美國醫師執照考試,可能又會讓這家該公司獲得一些好處。至於列名這篇論文作者的研究人員中,有些人是在Ansible Health這家位於矽谷的早期風險投資醫療保健初創公司工作,也多少會讓人有不同的想像空間。

或許已察覺到些許風險,投資入股OpenAI公司的微軟創辦人比爾蓋茲於2023年2月7日接受媒體採訪時表示,他雖對ChatGPT這款聊天機器人及AI領域最近的亮眼表現感到興奮,但還是建議ChatGPT不妨在三個潛在用途多加著墨,分別是在缺少醫療資源的部分非洲地區當個稱職的醫療顧問,充當數學輔導老師,以及像莎士比亞那樣寫詩,散發出更貼近人性的關懷與溫暖。

這些不同聲音背後,我們也不該再置身事外,而應接受AI技術可以協助醫師診斷、治療和開列藥物處方箋等這個逐漸成真的事實。不管怎樣,由ChatGPT帶動的這場快速變局,已促使我們不得不慎重思考AI、醫師與病患之間的關係,以及AI對各行各業的衝擊。

若您對本文有任何批評與建議,歡迎點擊填寫意見表

歡迎點擊訂閱電子報,獲得最新文章訊息。