元智大學資管系第二十七屆實習報告-ZW01
摘要
由於世界科技的發展,近年來許多電子用品的使用率越來越普遍於大眾,也大幅增加了罹患眼睛疾病的風險。而由於有許多的眼睛疾病的病患,而造成眼科醫師的工作量大幅增加,因此我們想藉由影像辨識眼睛疾病來減少眼科醫師的工作量。我們的訓練集來自於Grand-Challenge上的ORID-2019所提供。我們採用ResNet50神經網路進行實驗。
實驗架構圖
所需要的各個模型在訓練時所輸入的資料皆經過資料增補以平衡資料。架構大致為可以分成幾個步驟,首先將圖片丟進模型訓練為近視與其他的模型中(Model M),輸出分類後被分到近視類的以圖片處理進行檢查,通過檢查確定就為近視類,第二步是將第一步驟被分為其他的圖片丟進模型訓練為白內障與其他的模型中(Model C),最後一步為將第二步驟被分為其他的圖片丟進模型訓練為青光眼與其他的模型中(Model G),最後輸出青光眼類或是其他類。
實驗方法
模型訓練
我們以ResNet50神經網路來訓練眼底圖,圖片在丟入訓練之前,先將圖片resize成224*224大小的圖片,再輸入進神經網路進行訓練,這次一共訓練三種模型分別為Model M、Model C、Model G。
三個模型所訓練的圖片數均為1000張圖片,實驗架構裡圖片被模型判別的順序為Model M、Model C、Model G。在圖片每次被一個模型判斷分類後後面的模型就不會再去判斷前面所被分出去的類別,因此三個模型訓練的設計有細微的不同。
由於資料集的不平均,因此利用資料增補的方式來平均資料集,避免各類資料樣本數差距過大而影響模型訓練結果,我們參考Data Augmentation作法將圖片翻轉、旋轉、偏移進行資料增補的動作。
資料增補
近視影像處理
進行圖片處理之前,須先了解近視有問題的地方,我們在以近視最明顯的特徵進行檢查。
近視發生病變的部位周圍變得一大片很明顯的白色,因此我們就從此特徵下手。利用影像處理光出白色的區域並計算面積,而面積紙大於特定數字就可辨認為近視。
辨識圖片
當前面的項目都準備好後進使用準備好的資料集(包含多種眼睛疾病)丟入架構裡面,首先進入Model M分類器後進入近視篩選器中輸出近視與非近視,非近視進入Model C中輸出白內障類以及非白內障類,非白內障類進入分類器Model G中最後分類輸出青光眼以及非青光眼。剩下的類別以分四類的模型下去辨識。
結果分析
在處理近視部分在分類器後加入篩選器後對準確度的影響如下,在加入篩選器前,350張照片中正確判別的有340張,而加入過後則變為348張,只有兩張近視的圖片被誤判成其他類。
在分離前面兩種眼睛疾病後,青光眼的辨識率有所提升,原本沒有資料處理之前,單純以訓練七類的ResNet模型去辨識350張的測試集,在青光眼的50張圖片中正確的張數是36張,正確率為72%,而加入架構後測試集的青光眼的正確張數為48張,正確率提升至96%,
在實驗整體的準確性,未加入架構的平均準確率為50%,其中在經過Model M、Model C、Model G後尚未分類的部分我們單純使用剩下未分類的類別所訓練的模型下去辨識。在加入架構後,平均準確率為73%。
而分別以kappa、F1、AUC、AVG數值來比較加入架構後模型訓練的結果。