您访问的页面找不回来了!
返回首页- 您感兴趣的信息加载中...
林强还指出,使用公开数据集还有一大弊端就是数据比较老旧,或者图像有残缺。即便采用临床数据,由于没有统一标准,人工标签的质量取决于标注医生的年资经验和责任心,常常出现层次不齐的状况。
在这一点上,彭卫军深有体会。“一开始我们也犯过错误,对标注没有足够重视,当时只要有经验的人就让他们去做标注,结果很是出乎意料。现在我们深刻认识到,标注的人员必须要非常有经验,这样出来的数据才是有效果的。”
依图医疗刚刚推出了可以进行乳腺诊断的人工智能系统,相比眼底和肺结节,乳腺x线钼靶阅片在前期人工标注上的难度更大。
“这也是为什么我们刚刚开始做信心满满,现在越做越谨慎。”彭卫军说,乳腺影像的干扰因素很多,乳腺上病灶的图像都是散的,不像肺结节的影像那么清晰,对普通医生都是一个考验,让人工智能学习就更困难。
据林强介绍,依图医疗为了解决这一问题,采用了多人标注对比、抽样检验的方式来提升标注质量。“同样一个病灶我们会两三个医生同时做标注,如果两个都是一致的,我们就认为这个数据可靠,如果不一致,我们会找一个更高年次的判断,两个人评估有争议的时候,请一个更高级的再做一次。”
澎湃新闻记者了解到,中检院正在推动AI标准数据集的建立,目前已经完成了眼底和肺结节两个病种的数据整理。每个标准库都邀请了十家企业共同探索标准的制定。
复星杏脉科技CEO何川对澎湃新闻记者说,标准的建立是一项大工程,涉及方方面面,包括:数据的标准,在医学方面的定义,一些名词的统一,质量体系的建立等。标准的最终达成需要医学、技术、监管等多方的讨论。
何川说:“整体的标准很难一步到位,我估计会陆续形成一些细分标准来下发。”