
「眼前的黑不是黑,你說的白是什麼白。」把這段摘自視障歌手蕭煌奇成名作品的歌詞,拿來連結到近年來最熱門的AI,似乎還挺搭配的。
只是,電腦所看到的世界,到底是什麼模樣?相信許多人都覺得好奇。1960年代,科學家將攝影機接上電腦,試圖讓電腦透過攝影機這雙眼睛來理解繽紛的世界,但攝影機輸入電腦的影像,其實是一個二維的矩陣,矩陣中只有色彩與亮度資訊,距離人類能分辨事物的程度,還有一段長遠的路要走。
研究過程中,科學家發現利用卷積(Convolution)的運算來處理影像,可以快速提取出影像中的一些特徵,像是圖片模糊化、找出圖片的邊緣等。在信號處理領域,卷積就像濾波器,眾多信號經過濾波器處理,可以把真正需要的部分提取出來,
環顧日常生活器物,收音機就是濾波器應用的典型例子,原本的廣播信號是FM xxx.x MHz,頻率很高,人的耳朵無法聽到,濾波器把高頻濾掉,只剩下人耳可聽到的頻率,這就是一維的卷積。
從聲音到影像,卷積的處理就得從一維擴展到二維,透過矩陣運算,可以提取想要的特徵,也可以快速改變圖像的顯示,Photoshop的濾鏡功能就是二維卷積的實際應用。雖然1960年代人工智慧的發展不如預期,卻讓影像處理的發展大步躍進,為之後的人工智慧發展打下良好基礎。
電腦處理能力雖越來越強,要讓它去認得圖片中有一隻貓,其實是一件非常困難的任務。「一場圍棋的可能性,大約等於二的604次方,但光是一隻貓的圖片 ,可能就有二的800萬次方種可能性。」(1),這意味要讓電腦認識一隻貓,其複雜度可能比2016年在圍棋界打遍天下無敵手的AlphaGO還高。
1998年,Yann LeCun利用卷積神經網路(Convolution Neural Network, CNN)成功應用在手寫辨識上(2)。到了2010,華裔科學家李飛飛建置了多達100萬張高幾度、多標籤的影像資料庫ImageNet,並且每年定期舉辦ImageNet影像識別大賽。ImageNet讓卷積神經網路快速發展起來,在2015年,總共152層的神經網路已經可以把電腦影像識別的錯誤率降到3.6%,超越了人類的平均錯誤率5%,象徵電腦比人類更能解決影像上的問題(1)。
2017年,因為AlphaGO的成功,機器學習大幅發展,Google實驗室開始將機器學習應用在醫學領域,在Detecting Cancer Metastases on Gigapixel Pathology Images(3)這篇論文中,利用卷積神經網路來預測癌症轉移,在Google提出Inception的演算法中,定位得分(FROC)達到 89%,明顯超過沒有限時的病理學家表現,他們的得分僅為 73%(5)。
之後,有許多研究開始利用卷積神經網路處理各種醫療影像,像是利用卷積神經網路在全切片影像中分辨各種組織結構(4);其中,台灣的研究團隊也不落人後,雲象科技在2021年以零細節標註零分割方法,得以將未經切割的病理全切片影像,直接用於訓練AI模型,成功超越美國知名病理AI公司Paige,論文也登上Nature Communications(6)。
未來的醫療科技發展,人工智慧勢必會成為不可或缺的強大工具,從影像、基因、病歷等各種資料的輸入,可以讓人工智慧分析出各種可能的病灶,相信可以大幅減少醫師的工作量,也能為病人帶來個人化的治療方案,讓人類生命得以延長,生命品質也能更加提升。
參考文獻
- 【探索20-5】電腦視覺:一場做了五十年的暑假作業, (available at https://case.ntu.edu.tw/blog/?p=33436 ).
- Y. Lecun, L. Bottou, Y. Bengio, P. Haffner, Gradient-based learning applied to document recognition. Proc. IEEE. 86, 2278–2324 (1998).
- Y. Liu, K. Gadepalli, M. Norouzi, G. E. Dahl, T. Kohlberger, A. Boyko, S. Venugopalan, A. Timofeev, P. Q. Nelson, G. S. Corrado, J. D. Hipp, L. Peng, M. C. Stumpe, Detecting Cancer Metastases on Gigapixel Pathology Images. arXiv:1703.02442 [cs] (2017) (available at http://arxiv.org/abs/1703.02442 ).
- L. Chan, M. Hosseini, C. Rowsell, K. Plataniotis, S. Damaskinos, in 2019 IEEE/CVF International Conference on Computer Vision (ICCV) (IEEE, Seoul, Korea (South), 2019; https://ieeexplore.ieee.org/document/9009552/ ), pp. 10661–10670.
- Google 用 AI 檢測癌症,準確率 83% 超越人類, (available at https://www.inside.com.tw/article/8709-assisting-pathologists-in-detecting-cancer-with-deep-learning ).
- C.-L. Chen, C.-C. Chen, W.-H. Yu, S.-H. Chen, Y.-C. Chang, T.-I. Hsu, M. Hsiao, C.-Y. Yeh, C.-Y. Chen, An annotation-free whole-slide training approach to pathological classification of lung cancer types using deep learning. Nat Commun. 12, 1193 (2021).