GMIS 2017 大会杨琼演讲:人工智能+医疗——噱头,还是未来?

杨琼2.jpg

全球机器智能峰会(GMIS 2017),是全球人工智能产业信息服务平台机器之心举办的首届大会,邀请了来自美国、欧洲、加拿大及国内的众多顶级专家参会演讲。本次大会共计 47 位嘉宾、5 个 Session、32 场演讲、4 场圆桌论坛、1 场人机大战,兼顾学界与产业、科技巨头与创业公司,以专业化、全球化的视角为人工智能从业者和爱好者奉上一场机器智能盛宴。

5 月 28 日,机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)进入第二天,全天议程中最受关注的是多位重要嘉宾出席的领袖峰会,包括《人工智能:一种现代方法》的作者 Stuart Russell、第四范式联合创始人兼首席科学家杨强、科大讯飞执行总裁兼消费者事业群总裁胡郁、阿尔伯塔大学教授及计算机围棋顶级专家 Martin Müller、Element AI 联合创始人 Jean-Sebastien Cournoyer 等。


下午,拍医拍联合创始人、首席科学家杨琼,发表了主题为《人工智能+医疗——噱头,还是未来?》的主题演讲,她探讨分享了人工智能如何推动医疗领域的进步,以及目前存在的困境是什么。以下是她的演讲内容。

拍医拍是一家致力于将人工智能技术应用到医疗领域的创业公司,之前我们的主要产品是医疗单据识别,现在我们的产品是智能影像辅助诊断,包括胸片的分诊,肺结节的检测,糖网的筛查等。

我曾在微软亚洲研究院,欧洲微电子中心,百度 IDL 工作过,在人工智能行业从业了 15 年,是什么促使我投身于医疗呢?


小时候,成为医生是我的梦想,长大后发现,很多顶级医生整天陷在日常琐碎的管理和大量门诊工作,不能把主要时间用于真正需要他的病人,而且以前信息化程度也比较低,医生无法有效、及时获得病人的信息,无法及早干预,也无法有效跟踪病人的信息以及愈后情况。

医生的生存状况是否能够得到真正的改善?医疗领域何时发生真正的变革?

人工智能能否真正帮助医生、患者,甚至整个医疗行业呢?

最近几年,变革的契机正在发生。国家医改力度越来越大,北京已成为医改的试点,分级诊疗也在逐步推进。

医学影像辅助诊断,临床的决策支持,辅助治疗,健康管理,生物医学研究,新药研发,人工智能正在渗透到医疗的各个方面,都有很多成功应用的例子。

2006 年开始,越来越多的公司加入医疗+人工智能领域,2016 年,比例最大,其次是 2015 年,这说明在过去的四年间,这一行业在迅速发展。

 主要得益于三个因素。首先,人工智能技术到了前所未有的新高度,AlphaGo、Siri,自动驾驶,充分体现了这一点。其次,计算机科学和神经脑科学的结合,使人类越来越能理解智能的本质,一定程度上推进了行业发展。再次,互联网飞速发展,有很多方便获得的海量数据,而大量开放平台和开源算法,都极大推进了产业发展。因为这些因素,我下定决心投身医疗行业。

下面介绍几个人工智能在医疗领域应用的案例。

① IBM Watson,这是 IBM Watson 在 2016 年医疗领域的布局,重点是肿瘤、慢病、健康应用、疾病的治疗,其次,布局精准医疗、体外检测、医疗影像、大数据、医疗服务。

② Oncology 产品,它的流程是:首先,分析医疗记录,包括结构化数据和非结构化数据。例如病人病例、患者信息,包括影像数据、化验结果、检查结果、手术记录、实时监测的各种数据等,通过分析这些数据,为患者提供多种治疗方案,而且对方案进行排序,并给出医学依据,医生就在这些方案中挑选。

这些过程,包含了大量人工智能技术,比如分析影像数据,进行结构化,这就涉及智能影像的辅助诊断技术语音病例的自动录入,这就是语音识别的技术;对病例进行分析,涉及自然语言理解;提供治疗方案,这就是知识推理的过程。

③ 人工智能在智能影像辅助诊断的应用。在影像领域,诊断的误诊率非常高,现在中国临床误诊率平均 27.8%,恶性肿瘤误诊率高达 40%。另外,影像科医生缺口非常大,每年中国医疗影像数据以 30% 的速度在增长,而影像医生的增长速度只有 4%,导致影像医生的工作高强度、高风险、高流量,进一步加大误诊、误判的概率。因此,我们很需要人工智能技术,将影像医生从繁重的劳动中解放出来,并且去帮助他们减少误诊率,提高准确率。

④ 眼科疾病的应用,一个重要应用是糖尿病性视网膜筛查。相对来说,糖尿病患者容易糖网病变,发病率 25-38%,病程越长,年龄越大,发病率越高。糖网还会导致不可逆性致盲性眼病,糖尿病患者患者失明几率比普通人高 25 倍,全球约有 4.15 亿糖尿病患者面临病变风险,中国约有 1.14 亿这样的患者,发病率可以达到 11.6%。利用人工智能技术做糖网筛查,很有意义。

去年,Google 领导,美国、印度多家公司、研究机构参与,45 名美国医生以及高级住院医师,对将近 13 万的眼底图进行了分类分级,让这些数据训练人工智能,经过八个月的工作,人工智能的特异性、敏感性大约达到 90% 的水平。

⑤ 药物研发。人工智能可以通过在分子结构数据库中筛选治疗方法,评估出 820 万种药物研发的侯选化合物。2015 年,Atomwise 基于现有的侯选药物应用,人工智能算法在一天之内就成功找到控制埃博拉病毒的两种侯选药物。一种新药,从药物发现到通过 FDA 的批准,平均需要花 97 个月,而进入临床实验阶段的药物,平均不到 12% 的药物真正上市销售。在人工智能和机器学习的整合下,人们有望在新药研发领域,平均每年降低 280 亿美金成本。

⑥ 基因测序。以前,要在上万个基因中发现致病基因,需要从这个家族里面的几个患者中进行采样,无异于海底捞针。现在,通过快速基因测序技术和 SNPs这样的工具,能快速定位到疾病的基因,分析患病的可能性、风险,甚至可以做个性化的医疗。人工智能推动了这个领域的发展。

 ⑦ 癌症检测。以前常用的方式是活体检测,从患病区域通过切取、钳取、穿刺获取病变组织的细胞,进行病理分析,这种方法虽然能使医生直观地分析病理图,但它的局限性在于,如果只从一个部位采样,不能充分全面反映病情。而有些患者不适合活检,比如一些年迈患者。现在液体活检技术,可以通过病患的血液或者尿液,发现特定 DNA,辅助判断他患癌症的可能性。

这是人工智能在医疗领域引用得较成功的方向。实际上,还有很多困难。

① 在数据层面,由于利益的条块分割,规范化标准的缺乏,数据之间互联互通非常困难。我们做医疗单据识别就发现,每个医院打印的医疗单据格式都不统一。全国将近 100 万家卫生医疗机构,业界以前常用的是基于模板的方法,但是如此多,如此不统一,不规范的数据,我们难道去建一百万个模板吗?

针对这个问题,我们首先识别每个个体,分析个体之间的相互关系、逻辑,然后去判断整体的一致性。具体来说,我们先识别各个识别项,比如检验项、检验结果、单位、参考范围、异常值等各个方面,识别各个要素之后,再分析各个要素之间的关系,是否处于同一行,同一列,整张单据的解释是否符合医学逻辑。如果这些要素发生碰撞,粘连在一起,我们会对它进行切分。如果这个医学的解释,不同的要素产生的医学解释有矛盾,系统会自动寻优,寻找冲突、矛盾最小的方案。通过这种技术,我们支持了全国 31 个地区,超过 10 万种版面的医疗单据,在词条识别准确率上达到了 96%。

② 由于信息孤岛,很多机构数据不足,不完备,严重不均衡。有些罕见病,比如神经母细胞瘤,发病率只有十万分之一。各种病的发病率不同,因此,数据严重不均衡。

我们如何处理这种情况呢?迁移学习、GNN 这样的技术足够了吗?迁移学习适合处理同一个数据源或者类似的数据源,不同任务,但是它无法处理不同数据源之间的学习,也不适合处理不相关问题之间的学习。

现场做一个提问,脑部疾病患者远少于呼吸病患者,我们要做脑部 CT 的疾病诊断,我们是否可以使用胸部 CT 图?我的建议是,可以用所有这些 CT 图训练一个预模型,把预模型的中间结果拿出来作为脑部疾病分类的输入。另外,我们发现,采用多维标注方式能缓解数据不足,严重不均衡的问题。比如,糖网筛查,不仅对眼底图片标注糖网病症的级别,同时还标注是否出血,是否有微动脉瘤,在哪里有微动脉瘤,有多少微动脉瘤,是否有软性渗出、硬性渗出,同时还标注视盘的大小、动静脉比、左眼还是右眼、患者的信息、年龄、性别等多维信息。

我们做胸片筛查,不仅告知这是正常或异常,还要告知异常的种类是什么,是属于肺大泡,肺气肿,还是胸部感染,当然,患者的年龄,也是非常重要的信息。通过多维标注,可以在一定程度上弥补数据的不足。

③ 医疗领域的标注,非常昂贵,需要专业的知识,语音标注、文字标注、人脸标注大部分普通人能做,但医疗数据不行,而医生的资源又非常稀缺,这就导致在医疗领域,很多数据没有标注,或者只是简单标注。

不同医生采用不同标准标注,每个医生的水平也各有差异。一些医院的门诊病例,医生在写症状和诊断结果时,比较随意,不规范,导致标注的数据,存在模糊,甚至冲突的地带。这类问题,我们该如何处理呢?从一定程度上说明,仅仅是迁移学习,或者是 GNN,或者是多维的标注,是不够的。

邓力老师在昨天的演讲中提到,无监督学习是未来大方向,我非常赞同,我希望更多人参与进来,帮助医疗行业解决问题。

泛化学习、自主学习,深度学习现在是否真正学到知识、总结知识,还只是简单记忆了这些数据?机器是否能够真正地自主学习,自主发展,自主成长,自主地发现矛盾,解决矛盾呢?这些都是值得深思、值得研究的课题。

④ 很多时候,医疗属于弱信号处理范畴,和自然场景下的图片不同。比如,胸片的图本身比较大,但是我们关注的 ROI 区域很小,钙化点非常小,但又要发现它。再比如,那些非 ROI 区域,周围的肌肉、骨骼比较亮,信号很强,而真正的关注区域,比如肺纹理区域信号是很弱的。这种情况,不能简单用传统的深度学习模型,因为这些信号属于弱信号处理范畴,我们要尽早加入类别的监督信息,而不是等到不断描述、重构,到最后的几层再去分类,不断把分类信息尽早引入网络结构。

⑤ 越来越多的设备、检查从院内转到院外,而且越来越小型化,便携化,甚至会植入我们的皮肤,身体,这要求我们的模型小,运算量小,能耗低。比如在身体埋一个电池,电池至少希望能够支撑十年以上。另外,计算量不能产生大量热量,热量高了,可能灼伤皮肤或组织,一般至少都要求小于 10 毫瓦,性能要非常稳定。因为我们不能频繁去维修。因此,这远高于一般工业级的要求,需要研究界和工业界,共同努力。

而在方法验证上,人工智能在医疗中的应用也面临很大困境,首先验证的时候,个体差异大,受干扰因素多。一个治疗的方案适用某一个人,并不见得适用于另一个人。

我们可以看到,人工智能带了很多变革,非常令人振奋。随着互联网医院、第三方影像中心等的发展,可以预见,人工智能改变传统的医疗服务方式,将会成为可能。

产业
暂无评论
暂无评论~
返回顶部