全国肿瘤登记中心发布的数据显示,在中国,癌症已成为疾病死因之首,发病率和死亡率还在攀升,癌症已成为非常重要的公共健康问题。其中,肺癌是发病率最高的肿瘤,也是癌症死因之首。在空气污染成为全社会热议话题的同时,对肺癌的诊疗也受到了极大关注。在早期肺癌的诊断过程中,肺部结节是非常重要的一环。

结节病是一种较常见的全身性疾病,病因不明。肺部结节是指通过医学影像学检查发现肺部直径≤3厘米的类圆形病变。一般情况下,结节多为良性,恶性结节95%会逐渐发展为肺癌,如果能够提前发现并诊断,在进行合理的治疗后患者基本上都可以痊愈,复发率极低。

虽然还不清楚结节的成因,但在医学技术日渐发达的今天,发现结节已经不难。肺部结节的CR/DR片(X线摄影信息数字化处理),检出率达到了6%-10%。如果用更高级的多排螺旋CT检查的话,100个人中约有40个人都能检出肺部有1-6枚结节。在这种情况下,如何快速、准确的判断病患肺部的结节是良性还是恶性就显得非常重要。由于对结节病的影像学表现及病理学特点认识不足,尤其对不典型者易造成误诊。

中国医师协会胸外科医师分会会长、天津市胸科医院胸外科主任、拥有数十年胸外科手术经验的张逊在接受采访时告诉记者,在过去的诊断过程中,对肺部结节性质的判断往往需要由经验丰富的专家进行。肺部结节的形态多样,分布的密度、形状是毛刺或光滑,以及具体位置都会影响到医生对结节性质的判断。经验丰富的医师对恶性结节的确诊率高达90%以上,而缺乏相关经验的医师却常常对此一筹莫展。

医疗资源分布失衡的问题一直困扰着我国,看病难,看病贵的问题虽然已经较过去大为缓解,但依然存在着“全国人民上协和”的问题。我国幅员辽阔,人口众多,基层医院无法解决的问题常常需要在大城市三甲医院进行诊疗。肺部结节的诊断费时费力,让患者和医生都处在焦头烂额的困境中。

在科技飞速发展的今天,技术可以极大抹平认知和经验方面的差距,尤其是在医学影像分析方面。

3月29日,阿里在云栖大会深圳峰会上展示了基于阿里云服务的超声甲状腺结节智能诊断系统的实际应用情况。这套系统利用机器学习和人工智能,将甲状腺结节诊断的准确率从60%-70%提高到了85%。在会上,广州医学院第一医院院长何健行说,“我们的诊断需要人工智能的辅助,使得检查让病患更有信心,降低漏诊和误诊率。“

随后,阿里云与英特尔、零氪科技联合宣布启动天池医疗AI大赛。大赛第一季将向早期肺癌诊断发起挑战。天池是全球规模最大的众智平台,汇聚了6万多名AI算法科学家。医疗大数据平台零氪科技为大赛提供经脱敏处理并由专家标注的高清胸部CT扫描影像数据。选手需要通过原始CT影像图片训练模型算法得到结节特征,最终实现对影像图片结节区域的智能化判断。

大数据和人工智能在医疗行业的应用覆盖风险管理、健康管理、生物科技、医学影像、药物挖掘、急救室监控、精神健康、可穿戴设备、虚拟护士助理、营养和病理等多个领域,阿里向外界展示的仅仅是在医学影像方面的应用。张逊认为,医学影像和病理诊断是人工智能最能够发挥其价值的领域。

实事上,在ET医疗大脑之前阿里云已经开始在医疗领域进行探索。去年,上海华山医院借助阿里云的计算能力,用数字化模型代替部分临床实验,以及模拟小白鼠的活体实验,用于加快特效药研发。

同样是在去年,华大基因、阿里云和安徽医科大学曾共同宣布,在21小时47分12秒内完成了1000例人类全外显子组数据的分析。40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。

张逊甚至认为,人工智能在医疗行业的大规模应用甚至可以改善困扰我国多年的医疗资源分配失衡问题:“普通医院的医生同样可以利用人工智能诊断各种疑难杂症,这将大大降低对专家医师的需求,专家号也将不再一号难求。”

实际上,医疗人工智能技术已经日趋成熟,以上这些事例都清楚的表明了这一点。那么为什么我们还是很难在实际操作中见到医疗人工智能的身影呢?

张逊认为,造成目前技术虽然已经成熟但难以实际推广应用的原因在于我国对于数据的法律仍然不够健全。

本次阿里云与英特尔、零氪科技联合举办的天池医疗AI大赛中使用的影像数据是来自全国各大医院、经过脱敏处理的,所以不存在侵权的问题。但在产业化的过程当中,病人的病历数据由各大医院保存,是涉及到病人本身、非常隐私的数据。目前,各大医院均出于安全考虑,拒绝为第三方提供这些病例数据。隐私泄露怎么办?数据丢失怎么办?违规使用怎么办?这些都是摆在医疗人工智能产业化必经之路上的问题。如果没有完善的法律保障和规范,对病例数据的深度挖掘就只能是纸上谈兵。

美国目前对病例数据的利用由《健康保险隐私及责任法案》(HealthInsurancePortabilityandAccountabilityAct,简称HIPPA)规范,其中规定,进行脱敏处理后的病历数据可以用于医疗研究和商用。HIPAA确立了一些强制条例,要求大力改变医疗服务提供者的从业方法,其中包括确立电子数据交换(EDI)、安全及所有医疗保健相关数据保密性的标准化机制。法案规定:病人的健康记录、管理记录和财务数据均采用标准化格式;每个医疗保健实体(包括个人、雇主、医疗计划和医疗服务提供者)均采用唯一认证码(IDnumber);运用安全机制确保识别每一个体的信息数据具有保密性和完整性。

目前我国在此方面的法律依然处于缺失状态,甚至可以说是医疗人工智能发展的最大障碍。实际上,不仅仅是在医疗行业,在整个数据行业中都存在这样的问题。众多有识之士已经在呼吁立法,建立数据开放标准、界定数据开放边界,在应用推广上采用循序渐进的开放原则,让我国把握机遇,做好数据开放与共享,打造全球科技竞争新优势。