赵泓维作者

2019MICCAI干货:AI成影像标配,医生到底需要什么?大佬们向影像领域传达了什么?

MICCAI(Medical Image Computing and Computer Assisted Intervention)始于1998年的麻省理工学院,第一届开办时,参与学术交流的学者仅400人。时至今日,MICCAI已成为医学影像分析行业的顶级学术会议。据会方统计,本次大会上,全球各地总共2400多名学者来到了深圳,共同探索医学影像的发展。

剧变不仅仅发生于参会人数的变化之上。从论文收录状况看,2019年MICCAI的论文接收量突破1000篇,相比于2017年,这个数字翻了一倍有余,而最终的收录数量也达到了538篇。

同样令人振奋的是国内巨头及医疗AI初创公司的崛起。根据不完全统计,腾讯觅影有8篇论文被收录;联影智能有7篇论文被收录;视见科技有6篇论文被收录;深睿医疗有5篇论文被收录;华为云有3篇被收录;图玛深维、致远慧图、浙大睿医均有3篇论文被收录;阿里达摩院有1篇被收录(论文内容简介见文末)。

MICCAI 2019大会主席、联影智能联席CEO沈定刚表示:“去年国内企业被收录的论文数量接近20篇,今年的数字大概在40篇,而国内被收录的论文总数应该在150篇这个水平。相对于往年,我们能够看到中国的医学图像研究实力增加非常快。”

在这些论文之中,“智能”是一个绕不开的词。可以预见,在未来的几年内,“影像智能”将持续成为医学影像界的重要话题。

人工智能占领医学影像领域崎作

“Deep learning dominates everything.” Inria研究主管Nciholas Ayache在MICCAI 2019的采访之中发出感叹,用一句话精炼概括了MICCAI的盛况。

相比于产业界,学术界似乎对医学人工智能的未来抱有更多期待与憧憬。环顾会场走廊,参与展览的500多篇论文大都使用了卷积神经网络相关算法,其内容既包括用深度学习重构影像工作流,又包括对单个病种的CT、病理等影像进行优化分析。

腾讯、联影智能、深睿、视见等企业的入选论文均在会场展示 

那么,这些论文是否反应了未来学术的研究趋势?人工智能的广泛应用是变革的一方面,更重要的是,各行业的技术正涌入医学影像领域。对此,IEEE TMI和Medical Image Analysis期刊编委会成员、CVPR和 MICCAI 的领域主席、MICCAI2020程序委员会联席主席周少华提出了未来人工智能三个可能发展的方向。

第一个方向是联邦学习(Federated Learning),这项“舶来技术”正成为医学影像数据隐私问题的重要解决手段。联邦学习过去由谷歌最先提出的学习方式,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私,广泛运用于保险行业的人工智能算法学习。

医疗行业面对同样严重的隐私问题,数据不能出院,而许多人工智能也进不了医院。隐私的泄漏风险很大程度上阻碍了人工智能的发展。

在医疗健康领域推进智慧医疗的过程中,病理报告、检测结果等病人隐私数据常常分散在多家医院、诊所等不同地区不同类型的医疗机构,联邦学习使机构间可以跨地域协作而数据不出本地,多方合作建立的预测模型能够更准确地预测癌症、基因疾病等疑难病。

第二个方向是深度学习自动化。周少华表示:“深度学习本身还是需要很多人工东西,比如建设数据人工标准,设计网络架构,设计损失函数。这些人工的东西是否能由机器来完成呢?以现在的人力数据处理速度,难以实现从点到线的突破,即只能单点解决问题。所以,深度学习也需要自动化,现在很多的学者也在研究这个问题。”

第三个方向是通用表征学习。问题仍然出在数据上,即在实际中,许多关联项目各自拥有一定量的数据,但这个数据难以支撑有效的算法,那么我们是否可以寻求一种通用的学习方式来同时进行所有的任务?

通用表征学习的好处在于:若存在任务较多,但每单个任务数据有限时,把这些任务和数据整合在一起或许可以获得更好的表达。这将技术能够一定程度上解决数据缺乏和多任务并行两个问题。

软硬结合是大势所趋,从以联影为代表的器械巨头中看初创AI的发展机会

软件如何发展固然重要,但作为这些算法的载体,医疗影像器械同样需要力量支持。

沈定刚教授在MICCAI 2019的Workshop中曾点明的器械发展的整体趋势,即由单模态、单流程向多模态,全流程不断进步,而人工智能技术将在其中发挥至关重要的作用。

在很长的一段时间内,影像设备的发展是单一的纵向发展,即从单参数影像向多参数影像靠拢;由低排数向高排数发展。这样带来的结果是医生诊断的准确率越来越高,但单位时间内需要处理的数据也就越来越多,实际上提高了医生工作的总量。

人工智能的发展则推动了影像设备的横向发展,即将过去单个的照片环节、导航环节、诊断环节、治疗环节等诸多环节连成一个整体,出具全栈式的方案。这种变革为医生带来的不仅仅是效率上的提升,更是工作模式的转变——将医生从机械劳动中解放出来,去进行更有价值的劳动创造。这正是联影智能所做的事,将优质的硬件与不断推陈出新的软件相结合。

联影智能COO詹翊强告诉动脉网记者:“联影走的是一条自主研发之路,即在研发设备的同时自研AI软件产品,以高品质、覆盖诊疗全流程的AI产品占领市场。”

“我们的做法是,从源头做起,以全线设备作为AI切入口,为设备赋能。此外,我们让AI更好地赋能临床,打造贯穿临床诊疗全工作流、覆盖多病种的AI。”软硬结合,联影智能具备了AI落地的天然优势——数据与应用场景。

而在自行研发AI的同时,詹翊强提出了联影智能自有的模式:“单个AI产品的开发成本高,但价值有限,所以联影智能正尝试找到一种更有效的模式进行AI开发,使整个开发流程规模化——打造联影智能独有的系列功能模块,并基于此开发AI产品。所以,我们在开发第一个AI产品的时候投入会很大,第二个AI产品投入会比较大,但当我们具备足够的AI功能模块时,开发后续产品,成本就逐渐减少。当我们的AI功能模块不断成熟,AI技术可能呈指数发展。” 

有着硬件的支持,无论是在应用场景上,还是商业入口上,联影智能都能拥有打一场持久战的资本。正如中国科学院深圳先进技术研究院研究员郑海荣所言:“如果AI技术是有价值的,怎么会通不过审批?这是迟早的事。” 

只是在国内整体的投资结构下,对于初创公司而言,没有审批的几年必然是一段困难的时光。毕竟,要想规模化、商业化,审批依然是一条“关键的圆木”,将AI初创企业卡在了河床之中。 

但也不必过分担忧,詹翊强表示:“医学影像AI的发展需要时间的沉淀与深度的挖掘。创新生态的构建也需要各界的共同努力。相信那些真正有实力的AI初创企业是能够坚持住的。”

那么医疗影像AI未来向何方?詹翊强同样提到了几个方向。 

第一,人工智能将成为影像标配,这一点已经反应在了许多先进设备之中,而技术上升来带的成本下沉终将把这一恩惠传递给更多的医疗机构。 

第二,个性化场景的优化将成为研究重点。随着深度学习的应用越多越多,标准算法应该根据具体问题做进一步优化。例如,人工智能需根据器官和疾病的特异性,进行一些网络结构、损失函数、监督任务的优化。 

对于医生而言,问题还不完全出在技术上

上述谈到的技术上突破离实际似乎还有一些遥远,而对于医生而言,眼下要解决的还是一些基础性的问题。作为本次MICCAI上一股重要的力量,医生团体则提出了不同的看法。

“现在我最希望解决的是数据方面的问题。”北京大学第一医院医学影像科主任王霄英在采访中表示。AI模型训练时使用的数据是经过清洗的,所以AI模型对于用于预测的影像数据的格式、质量均有一定要求。但在实际工作中,按照常规影像检查流程生成和存储的图像数据很多不能满足AI算法的需求,预测效果就受影响。 

“目前数据处理流程和AI预测流程是脱节的。在AI接入临床工作时,如果是由医生人工把AI可以识别的影像分离出来,再交给AI处理,就不能实现全流程的自动化。未来我们希望通过临床操作的规范化、算法模块的增加、算法能力的提高来处理好这些问题。” 

另外一个问题来源于医生对AI的体验,尽管影像医生很多都听说过人工智能,但真实接触过AI的医生不多,技术下沉仍需各方共同努力。 

同时,医生接受AI需要更多的知识普及。“医生从初始教育开始,便建立了‘根据机制去理解现象,再根据现象去推测机制’的逻辑,即医疗是交织着无数联系的一门学问,对任务结果的解释都需要谨慎对待。AI的‘输入’、‘输出’过程应使医生能够理解,否则医生难以信任这一黑盒过程。”王霄英主任表示。

繁荣背后,人工智能算法仍有待突破

总的来说,MICCAI的繁荣印证了AI医学影像领域的繁荣,这里也有足够多的研究成果等待着转化,也有足够多的问题有待继续挖掘。 

但是我们也需警惕技术的局限性。深度学习作为一项拥有近40年历史的技术,至到2012年卷积网络的出现才有了今天繁荣。但数年的发展或许已将技术红利消耗殆尽,在人工智能的三大影响因素——算法、数据、算力中,“数据”已经被冠以核心影响因素很长一段时间,那么算法如何突破呢? 

对于这个问题,周少华表示:“我们无法估量下一次算法的突破会在什么时候,不过现有的算法体系的确不能满足人们想象中的人工智能。下一个的智能在哪里?这还需要各行各业领域学者的共同努力。” 

附表:2019年MICCAI论文收录情况(仅包含国内企业部分)

动脉网
动脉网

专注医疗产业服务平台

产业医疗影像
相关数据
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
图玛深维机构

图玛深维由两位前高通公司深度学习和计算机视觉学专家创立,公司首将人工智能与深度学习技术引入到医学领域,是中国技术最领先的人工智能公司之一。我们的业务主要包括三大类:深度智能诊断,智能医疗数据分析,云端CAD。目前,公司已经在北京、苏州、上海、美国圣地亚哥设立了研发团队。图玛深维拥有世界前沿的深度学习技术,在人工智能肺结节检测、全自动病灶分割、良恶性分析、 影像组学提取、肺结节多周期随访等功能方面都遥遥领先于同类产品。现阶段,公司已经和 50家三甲医院的多个临床科室开展深度科研合作,并在不同产品线上做丰富和迭代。同时计划推出多类肿瘤疾病,心血管疾病,脑血管疾病自动检测的基于深度学习的诊断产品。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

表征学习技术

在机器学习领域,表征学习(或特征学习)是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前,机器学习研究人员需要利用手动特征工程(manual feature learning)等技术从原始数据的领域知识(domain knowledge)建立特征,然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效,但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点,它使得机器不仅能学习到数据的特征,并能利用这些特征来完成一个具体的任务。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

规范化技术

规范化:将属性数据按比例缩放,使之落入一个小的特定区间,如-1.0 到1.0 或0.0 到1.0。 通过将属性数据按比例缩放,使之落入一个小的特定区间,如0.0到1.0,对属性规范化。对于距离度量分类算法,如涉及神经网络或诸如最临近分类和聚类的分类算法,规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘,对于训练样本属性输入值规范化将有助于加快学习阶段的速度。对于基于距离的方法,规范化可以帮助防止具有较大初始值域的属性与具有较小初始值域的属相相比,权重过大。有许多数据规范化的方法,包括最小-最大规范化、z-score规范化和按小数定标规范化。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

推荐文章
暂无评论
暂无评论~