相较于其他大多数学习模型的“从零开始”,“迁移学习”先利用卷积神经网络(Convolutional Neural Network,CNN)学习已有的已经标记好的预训练网络系统。
以医学图像学习为例,该系统会识别预系统中图像的特点,研究人员再继续导入含有和第一层图像相似参数和结构的网络系统,最终构建出终极层级。
张康等人的系统中,第一级网络是视网膜OCT图像,第二级网络系统使用第一级的图像寻找相应的特点,通过前向传播固定低层图像中的权重,找到已经学习的可辨别的结构,再利用反向传播的方法提取更高层的权重,在其中进行反复的自我调整和反馈、传递,达到学习区分特定类型的图像的目的。
张康表示,“这个模型可以使用极少的训练图像,更快、更高效的辨认图像的特定结构。”
张康还提到,迁移学习能让深度学习变得更加可靠,还能帮我们理解深度学习的模型。比如,我们能够知晓哪部分特征容易迁移,这些特征所对应的是某个领域比较高层、抽象的一些结构型概念。把它们的细节区分开,就能让我们对这个领域的知识表达形成一个更深的理解。
“这样一来,机器就可以像生物的神经系统一样终身学习,不断地对过去的知识进行总结、归纳,让一个系统越学越快,而且在学习过程中还能发现如何学习。”张康认为,“迁移学习”在深度学习上面有极为广阔的应用前景,在图像数据资源有限的医疗领域,更高效、所需图像数量更少的“迁移学习”,可以说是未来5年内AI发展的热点以及深度学习成功应用的驱动力。
致盲性眼病诊断超越人类专家
张康等人将上述“迁移学习” 主要应用于诊断视网膜OCT图像。
视网膜OCT使用光来捕获视网膜的高分辨率体内光学横截面,该截面可以形成活体视网膜组织的三维体积图像。目前,该技术已经成为眼科中最普遍使用的诊断技术之一,每年有近3000万次视网膜OCT图像产生。
论文中指出,目前OCT成像已经在全球范围内成为医生们诊断治疗某些致盲性眼病(年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿)的一项标准技术。