資源中心分類:人工智慧
文章標籤:

「眼前的黑不是黑,你說的白是什麼白。」把這段摘自視障歌手蕭煌奇成名作品的歌詞,拿來連結到近年來最熱門的AI,似乎還挺搭配的。

只是,電腦所看到的世界,到底是什麼模樣?相信許多人都覺得好奇。1960年代,科學家將攝影機接上電腦,試圖讓電腦透過攝影機這雙眼睛來理解繽紛的世界,但攝影機輸入電腦的影像,其實是一個二維的矩陣,矩陣中只有色彩與亮度資訊,距離人類能分辨事物的程度,還有一段長遠的路要走。

研究過程中,科學家發現利用卷積(Convolution)的運算來處理影像,可以快速提取出影像中的一些特徵,像是圖片模糊化、找出圖片的邊緣等。在信號處理領域,卷積就像濾波器,眾多信號經過濾波器處理,可以把真正需要的部分提取出來,

環顧日常生活器物,收音機就是濾波器應用的典型例子,原本的廣播信號是FM xxx.x MHz,頻率很高,人的耳朵無法聽到,濾波器把高頻濾掉,只剩下人耳可聽到的頻率,這就是一維的卷積。

從聲音到影像,卷積的處理就得從一維擴展到二維,透過矩陣運算,可以提取想要的特徵,也可以快速改變圖像的顯示,Photoshop的濾鏡功能就是二維卷積的實際應用。雖然1960年代人工智慧的發展不如預期,卻讓影像處理的發展大步躍進,為之後的人工智慧發展打下良好基礎。

電腦處理能力雖越來越強,要讓它去認得圖片中有一隻貓,其實是一件非常困難的任務。「一場圍棋的可能性,大約等於二的604次方,但光是一隻貓的圖片 ,可能就有二的800萬次方種可能性。」(1),這意味要讓電腦認識一隻貓,其複雜度可能比2016年在圍棋界打遍天下無敵手的AlphaGO還高。

1998年,Yann LeCun利用卷積神經網路(Convolution Neural Network, CNN)成功應用在手寫辨識上(2)。到了2010,華裔科學家李飛飛建置了多達100萬張高幾度、多標籤的影像資料庫ImageNet,並且每年定期舉辦ImageNet影像識別大賽。ImageNet讓卷積神經網路快速發展起來,在2015年,總共152層的神經網路已經可以把電腦影像識別的錯誤率降到3.6%,超越了人類的平均錯誤率5%,象徵電腦比人類更能解決影像上的問題(1)。

2017年,因為AlphaGO的成功,機器學習大幅發展,Google實驗室開始將機器學習應用在醫學領域,在Detecting Cancer Metastases on Gigapixel Pathology Images(3)這篇論文中,利用卷積神經網路來預測癌症轉移,在Google提出Inception的演算法中,定位得分(FROC)達到 89%,明顯超過沒有限時的病理學家表現,他們的得分僅為 73%(5)。

之後,有許多研究開始利用卷積神經網路處理各種醫療影像,像是利用卷積神經網路在全切片影像中分辨各種組織結構(4);其中,台灣的研究團隊也不落人後,雲象科技在2021年以零細節標註零分割方法,得以將未經切割的病理全切片影像,直接用於訓練AI模型,成功超越美國知名病理AI公司Paige,論文也登上Nature Communications(6)。

未來的醫療科技發展,人工智慧勢必會成為不可或缺的強大工具,從影像、基因、病歷等各種資料的輸入,可以讓人工智慧分析出各種可能的病灶,相信可以大幅減少醫師的工作量,也能為病人帶來個人化的治療方案,讓人類生命得以延長,生命品質也能更加提升。

參考文獻

  1. 【探索20-5】電腦視覺:一場做了五十年的暑假作業, (available at https://case.ntu.edu.tw/blog/?p=33436 ).
  2. Y. Lecun, L. Bottou, Y. Bengio, P. Haffner, Gradient-based learning applied to document recognition. Proc. IEEE. 86, 2278–2324 (1998).
  3. Y. Liu, K. Gadepalli, M. Norouzi, G. E. Dahl, T. Kohlberger, A. Boyko, S. Venugopalan, A. Timofeev, P. Q. Nelson, G. S. Corrado, J. D. Hipp, L. Peng, M. C. Stumpe, Detecting Cancer Metastases on Gigapixel Pathology Images. arXiv:1703.02442 [cs] (2017) (available at http://arxiv.org/abs/1703.02442 ).
  4. L. Chan, M. Hosseini, C. Rowsell, K. Plataniotis, S. Damaskinos, in 2019 IEEE/CVF International Conference on Computer Vision (ICCV) (IEEE, Seoul, Korea (South), 2019; https://ieeexplore.ieee.org/document/9009552/ ), pp. 10661–10670.
  5. Google 用 AI 檢測癌症,準確率 83% 超越人類, (available at https://www.inside.com.tw/article/8709-assisting-pathologists-in-detecting-cancer-with-deep-learning ).
  6. C.-L. Chen, C.-C. Chen, W.-H. Yu, S.-H. Chen, Y.-C. Chang, T.-I. Hsu, M. Hsiao, C.-Y. Yeh, C.-Y. Chen, An annotation-free whole-slide training approach to pathological classification of lung cancer types using deep learning. Nat Commun. 12, 1193 (2021).