人工智能与医疗,正成为人工智能时代重头戏

报道 |  微胖


智能与医疗,正成为人工智能时代重头戏。


2017 年被认为是「人工智能应用元年」,亦是人工智能发展的拐点。7 月 9 日,全球人工智能高峰论坛暨中国(杭州)人工智能小镇启动仪式在杭州召开。在本次论坛的「人工智能医疗健康分论坛」上,专家、学者以及业内人士就人工智能在医学领域应用展开了交流。

据近期普华永道报告分析,2030 年之前,中国和美国将成为从技术浪潮中收获最多的国家。未来的 13 年内,人工智能将增加中国 7 亿万美元的 GDP,经济增长达 26%。其中,医疗成为人工智能最富变革力领域之一。医疗领域是典型数据密集型行业,在智能化时代,数据生成速度的提升也带来了医疗数据积累量的大幅增加。尤其是在基因和医学影像领域,人工智能技术极大加快挖掘提取深层次信息的效率,由此也释放出大量创业和商业机会。

过去十几年,中国医疗行业的信息化也积累了大量历史数据;人工智能技术也取得了巨大进展。场景、数据、技术的具备为行业变革奠定了基础。中国医疗行业也面临不少问题,比如,中国医疗资源总量不足、分布不合理、优质资源匮乏。看病难、看病贵的问题的核心表现为供需矛盾,资源严重不足。另外,医疗失误造成大量生命和财产损失,数字同样让人惊心。全球每年有 4300 万人受到医疗失误的波及,其中大部分发生在中低收入国家。

数据显示,2017 年第一季度有 30 多家人工智能企业获得融资,医疗健康领域的人工智能创业公司表现尤为突出,关注度和融资量最高。「当我们把目光聚焦向人工智能医疗健康领域,不难发现人工智能已经应用到医学影像识别、疾病辅助诊断、外科手术、基因测序以及医疗大数据等许多方面。未来五年,医疗健康将会是人工智能最重要的应用领域之一。」

在本次论坛的「人工智能医疗健康分论坛」上,「人工智能+医疗」领域的首个产业联盟——健康产业人工智能技术创新联盟在本次论坛上正式成立。健康产业人工智能技术创新联盟由科大讯飞、复星医药、德勤咨询、思创医惠、荣之联、Boston AI、浙江知识产权交易中心、杉杉医疗、贝壳社等单位联合发起,旨在打造医疗人工智能应用聚集地,搭建医疗人工智能产业生态链示范平台和中国医疗人工智能核心技术平台。

一、专家把脉,医疗行业的人工智能应用存在四大痛点


在医疗领域,人工智能技术应用存在四大痛点,麻省理终身教授、波士顿人工智能实验室主任曹渔在题为《端智能在医学领域的应用》的发言中谈到。针对这四大痛点,他认为端智能在中国医疗领域当中会大有可为。

                                

曹渔谈到,所谓端智能,是指把人工智能的算法、架构部署在终端,在终端领域,运行我们的计算。在这种情况下,我们可以保证我们的计算不依赖于网络,同时我们可以实现实时的数据处理。更重要的是,我们可以保护用户的隐私,而且实现个性化的定制。在这基础上,有可能产生很多新的商业模式。我们认为,端智能是推动垂直领域人工智能化最重要的技术之一。

2016 年美国的主流 ID 厂商逐步布局边缘计算和端智能。在过去的一两年之内,大概有近 20 家与端智能相关的企业获得超过 5 亿美元的融资。在 2017 年到来的时候,边缘计算已经迅速发展成为 10 亿美元的技术市场。近期,微软公司宣布进行重大转型,专注云计算和端智能也是未来的方向之一。

那么,人工智能的医学应用存在什么痛点呢?

首先,异构数据普遍存在。在医疗领域有医疗图像、视频数据、音频数据、结构化数据、非结构化数据、文本数据。每一种数据的处理方式、存储格式、传输方法、算法都不尽相同。不可否认,一旦理顺了多格式,多源头,呈爆炸性成长的大数据的整合和分析,医疗大数据将对提高医疗质量,强化患者安全,降低风险,降低医疗成本等方面发挥无与伦比的巨大作用。但是,怎么样能够开发一个有效的人工智能的系统,能够把这些多模态的数据利用起来,作出更好的诊断和治疗,这是非常有挑战性的任务。

其次,有效数据的缺失。其实,很多应用里面其实没有大数据,只有小数据。如何解决?当我们只有小数据的时候,仍然希望能够训练一个很好的模型。在这种情况下,用迁移学习的方法就可以做到用一个领域的大量的数据,通过迁移学习的方法,到新的领域进行学习,达到类似的效果,解决小数据训练问题。

第三,缺乏个性化模型。其实这和精准医疗密切相关。精准医疗的目的是实现千人千面,但离我们的目标还有一定的距离。可以用增量学习的方法,来解决个性化模型定制问题。所谓「增量学习」,是指最开始的时候,用数据学到一个通用的模型,这个通用模型会教给用户和病人。在跟病人进一步交互过程中,我们用增量学习的方法更新模型。在这种情况下,我们就可以定制一个模型。比如说一种治疗的方法、一种诊断,在某一个病人的手中,经过一段时间的交互,经过一段时间的数据积累,它的模型会发生变化,实现理想中的千人千面。

第四,技术架构和系统功效。在传统的云计算里面,在云端有很强的计算能力,不用考虑功耗。但是,在终端必须考虑功耗,我们手机一天要充电,在这种情况下我们必须考虑到如何重新开发技术架构,使系统更高效。特别是在传统云计算里面,数据要传到网上,传到云端。但是,很多医院不允许把数据传到云端,即使传到云端,也存在很大的隐私泄露的领域。所以在医疗领域,我们希望把数据留在本地。问题就出现了,怎么样才能使本地计算更有效、高效地技术?这是我们认为具有挑战的方向。

端智能如何解决医疗中的技术挑战?简单来说,将人工智能算法部署在医疗的终端,实现本地计算和个性化模型的定制,从而确保病人的隐私和数据安全,从高层次角度解决医疗技术的挑战。

二、科大讯飞布局人工智能在医学影像中的应用


贝壳社创始人姜慧霞在《共建医健人工智能产业加速生态系统》的发言中指出,从统计出来的过去融资的轮次来看,很多都是很小的公司,或处在初创早期,可能也就是十几个人,或者更小。大部分处于 A 轮、B 轮,很多都是天使轮。但是,越来越多的大公司关注人工智能,更多跟人工智能项目或者团队进行一些合作。另外,市场增长,到 2018 年市场规模达到 200 亿,增长率达到 40%,「未来 4-5 年,会有一批伟大的人工智能公司创立。所以人工智能特别是在医疗领域的创业,它其实刚刚开始。」

             

普华永道报告分析指出,人工智能覆盖领域中,最具潜力的三个医疗领域之一就是影像诊断(图像诊断,病理诊断)。人工智能在医学影像中的应用,也是我们最为熟悉的。比如,最近吴恩达领导的斯坦福大学机器学习组开发了一种深度神经网络,从心电图中识别 14 类心律不齐;年初,斯坦福大学一个联合研究团队开发出了一个皮肤癌诊断准确率媲美人类医生的人工智能,相关成果刊发为了 1 月底《自然》杂志的封面论文;FDA 首次批准了一款心脏核磁共振影像 AI 分析软件,等。

科大讯飞鹿晓亮介绍说,除了将讯飞最擅长的语音技术用到医疗,帮医生写电子病例和医疗文书,医疗影像的服务诊断系统也是科大讯飞的布局重点。

        

讯飞一直有关注计算机视觉领域,也一直有计算机视觉团队,有不少同事在从事这方面的工作。公司实际上拥有比较强的包括人脸识别、OCR 等在内的技术。讯飞系统不仅要能够处理这个人的胸片或 CT 影像,还要同步处理他的其他非结构数据,把这些数据融合在一起,最后帮助医生做一个整体的判断跟方案的建议,这个是讯飞与其他公司的最大不同。科大讯飞希望把这样的技术应用到医疗领域,帮助以后找肺部 CT 结节,帮医生看骨科的片子。在这些领域,机器可以做得比人类更好。

目前,人工智能在医学影像中的应用主要就是辅助医生做诊断,让医生做诊断的时候做到有理有据,从而减少误诊、漏诊率。从影像方面的误诊人数来看,美国每年的误诊人数达到了 1200 万,中国因为人口基数庞大,达到了惊人的 5700 万/年,这些误诊主要发生在基层医疗机构。电子胶片的广泛使用使得医学影像数据大幅度增长,美国的数据年增长率达到了 63.1%,在中国也达到了 30%。放射科医生的年增长率美国和中国仅只有 2.2% 和 4.1%,远远低于影像数据的增长,形成巨大缺口。这意味着医师工作量大增,判断准确性下降,借助人工智能对影像进行判断可以有效弥补该缺口。

科大讯飞在医疗上的布局,其实除了这些,还立志做好医生的助理。据普华永道分析预测,这属于高潜力的用例。也就是说以数据为驱动,通过将患者的病史作为基准,调查偏差数据或标识,这样的诊断方式在初始阶段将是人类医生的助手,并不能替代人类医生。但是,能提高医生的诊断效率和准确度,AI 在此过程中也能不断学习、改进,人类医生和 AI 诊断的结合,将提高系统的准确性,随着时间的推移,人类将有足够的信心,将诊断任务完全委托给 AI 系统,让 AI 自主操作。

据鹿晓亮介绍,现在他们在一步步地扎实工作。比如,他现在给研究院设定一个小目标,就是到今年 8 月底,人工智能系统要能够通过中国职业医师职业考试笔试。就是 600 道选择题,现在医学院学生或者社会上的人只要 360 分能通过考试,希望科大讯飞的人工智能系统 8 月底能考到 400 分。

三、基因数据规模激增,创业公司瞄准数据分析瓶颈


随着基因检测的价格不断降低和日益普及,基因领域数据规模激增,如何这存储、分析以及解读成为行业必须要突破的瓶颈和壁垒。目前在中国只有少数的顶端的三甲医院,甚至一些顶端的医学团队才能够分析这个技术。创业公司希望借助人工智能让这些技术惠及大众。

与会的北京基云惠康的郝向稳介绍说,公司云分析服务专注于个人全基因组数据分析。基云惠康属于 SaaS 服务,以阿里云为基础,针对全基因组数据,提供更快,更低成本的优化服务,主要服务 B 端用户。「全基因组数据分析和解读,涉及 90 个 GB 的数据,有 2 万多个基因。我们要对这些基因做一个全面的解读,里面涉及到非常多维度的数据,不光是 DNA 序列,还有人的表情数据。针对那么多维度的数据进行分析,不是我们原来说的做一个简单的统计分析,就可以把这个事情完全做完。」

             

上海易瑞生物科技有限公司吕晖介绍说,易瑞也是以基因检测为基础,用数据分析和人工智能做个性化的健康和医疗服务工作。「基因数据有非常丰富的数据,但解读出来的部分其实很少。而且这个解读,也是全世界分子生物学家用几十年时间解读出来。所以现在到了这个时间点,我们觉得到了人工智能开始介入部分了。我们一方面的技术是做基因组,还有是其他多组学的整合,这是数据方面的发展。」

聚道科技的业务更加底层,为基因领域搭建云环境。2014 年,一批阿里出身的技术团队成立了基因大数据计算服务平台聚道科技。李厦戎介绍说,聚道科技在基因领域帮助企业解决精准数据及大规模的数据计算,包括更多表情数据整理、整合的需求。背后的数据包括数据的传输、分布式存储和计算的技术,还包括数据的管理以及怎么样提供一些协作化、标准化的数据标准和计算的标准。另外,公司也可以再跟一些临床机构合作,做一些基于人工智能的,对遗传性疾病和罕见性疾病的基因推断。

               

目前,大多数企业都还是 A 轮或者 A 轮以前的初创公司,市场还属于酝酿阶段,大部分仍聚焦数据分析环节,云服务是一趋势。

四、展望未来,职业替代还太早,数据难题不可忽视


在分会场的圆桌论坛上,大家讨论了人工智能对医疗领域医生职业的影响以及对行业未来的展望。

             

人工智能技术会对医生职业产生怎样的影响?

德勤中国创新领导合伙人冯晔谈到了德勤的经验。他说,德勤很早就已经引入了科技,我们自己在做一些机器学习,审计或者税务甚至律师大型的文献,或者说文档都是用机器读的。最近,大家可能在网络上看到很多财务机器人,也是我们创新中心一起研发了。我们现在有一个很好听的名字,我们叫机器为「小勤人」,当然我们也希望走出财务和税务机器人的范畴,向医疗健康领域发展。

人工智能的出现,很多人职业会消失?首当其冲的就是财务、会计、税务或者一些重复劳动的工作。我们自己也在分析自己公司一些工作的性质,比如说像审计。审计最痛苦的是在什么时候?就是在最后的出报表的时候,大家大量的时间用于加班,大量的时间用于对账、对数据,包括前期大量的时间在抽样板。其实,我们已经采取了很多的方式,比如数字分析、数字挖掘的方式,包括我们自己也开发了报告系统,一键生成的报告系统,只要有三张财务系统,至少可以把整个审计报告的数字部分全部放进去,而且前后没有偏差。大家也知道审计报告前后有多级关系,如果让系统去做这个事情,未来可能人工智能来做事情,这个时间就不需要了。

             

有那么多时间被节省下来,那人员的成本应该下来了?目前来看,不是那么明显。事实上,你可以把重复劳动时间转化为为目标客户提供更多价值的时间,更多地了解他的业务,更多和他分析他的业务,以及去探索他的商业模式,找出他目前碰到的一些问题。我觉得从这一点来讲,招募一些相对来说低级别的人员,每年数量已经下降。我们的业务(客户群)其实在增长,其实从这方面来讲,相对来讲,我们的人数在这方面已经降低了,其实我们只是把一些重复劳动的事情转化到了更有价值的能跟客户交互的事情上来,这是我们想做的事情。使用高科技,来为客户提供高价值的服务,这是我们的目的,正在这个过程当中。未来的趋势都是这样的。

德勤也在跟医院直接合作,我的感觉是,人工智能是导致社会现有职业的消失,我不认为这个职业会完全消失,但是,这些人的工作性质会发生变化。比如说影像读片的人,还包括做基因分析也是一样,他中间有很大一部分是重复工作。一个是他需要很强的记忆,又需要不知疲倦地做,这一类工作会被机器很快地代替。如果这个职位,当年是因为这个技术比较好,不幸的是你要学新的技术了。

另外,我感觉在最近的将来,这些职业不会完全被代替,因为它还要跟人打交道,这其实就像交通的「最后一公里」,这最后一公里很难做,还是需要人做的。就像遗传咨询师,以前为什么他难培训?因为他掌握基因知识需要很长时间。在人学起来非常困难的一部分,机器很容易代替,我们现在开发的系统也是这样,就是基于基因型的表情辅助诊断,医生就会很快明白。以后医生咨询师的时候就会集中在怎么从现有的知识和病人的沟通上,而不是花在查询文献和知识库上,然后判断这个知识到底是对还是错。所以,我认为这方面,他不会完全消失,但是他的工作会有改变。

聚道科技的李厦戎认为,从基因领域来讲,其实基因领域有大量的未知,这些未知是需要人去利用,而不完全靠机器理解。所以,从某种程度上来讲,这个领域还存在着大量的机会,需要更多人去加进来,而不是减少职业,需要更多的职业会出现。其实像常规的遗传咨询,它会自动化做一些分析。但其实还会存在大量的罕见性和疑难的病例,这些病例可能就需要很多背景更加强的遗传专家,甚至一些研究人员进一步研究背后生物学的机理。这时候,需要大量人去参与。

科大讯飞的鹿晓亮表示,人工智能也只是一项技术而已,它跟其他的产业革命相比,没有什么过人之处。现在的人工智能要真正让我们的机器有意识、有感情,这还离得远。包括刚才说的人工智能有可能会代替放射医生,帮助医生阅片。这些知识在非常垂直的领域,对医生来说是一个非常繁重、非常繁杂的工作上,我们的机器有可能会代替人类。整体而言,现在人工智能是处在弱人工智能的阶段,它没有通用性,不像人类大脑一样有通用性。我们语言识别系统,识别中文可能识别得很好,让它识别法语,就会识别得乱七八糟。所以,这是目前人工智能发展的阶段,我们把它定义为弱人工智能阶段。现在很多人工智能威胁什么,这些东西现在为之过早。但不可否认的是,我们现在的人工智能即使只能做某一个垂直领域的工作,它也是可以在这个领域里面做得比人类好,可以在某一个具体点上帮助人类,甚至替代人类。

未来五年甚至二十年,人工智能技术会对医疗领域产生什么影响?

首先,数据孤岛和数据重复性问题。医疗行为过程将医疗大数据分为诊疗数据、研发数据、科研数据和支付数据四种,而不同的数据类型又在智慧医疗中有不同的价值。比如,诊疗数据可以为公共机构和医院提升医疗服务质量提供数据依据,以实现有效的疾病管理和公共卫生建设;同时,诊疗数据也可以帮助个人进行疾病预防,进行慢病管理。当这些数据在医疗行业充分得以运用就会带来巨大的经济价值。

虽然智慧医疗前景广阔,但是,数据孤岛是现阶段限制医疗大数据价值变现的首要因素,行业割据又加剧了数据孤岛的恶化。由于缺乏统一的医疗信息平台,不同的医疗机构之间、不同的区域医疗信息化平台之间都存在数据割裂,甚至个人健康数据也会因为不同的可穿戴设备而储存在不同的 APP 上形成数据割裂。数据孤岛和行业割据问题,不仅影响了大数据在智慧医疗中的作用,更对提高利用医疗资源效率,实现大数据价值变现产生阻碍。

德勤的冯晔表示,在基因测序领域,现在影像识别都用了很多大数据、云计算等等一系列的高科技手段。目前,因为数据孤岛的情况是存在的,未来的情况下,这个精准度,尤其是在诊疗方面,找出一些疑难杂症,通过人工智能能得到更好的精准度的提高,能解决一些疑难病症,使用人工智能会更好。

易瑞科技创始人兼首席科学家吕晖表示,从技术来讲,确实现阶段三五年之内,咱们要解决重复性的问题。因为我们也是着重于收集病人和健康人群的数据,因为有这个数据才能做更好的服务。所以技术上来讲,现在需要把这些数据规范化,规范化才能学。但是,在医疗上,目前这个阶段,它面对的医学问题不是一个完全封闭的系统,我觉得在二三十年之后,其实现在人工智能的理论需要有一个飞跃,我认为,不一定是突破,因为算法其实已经在那儿。

              

人工智能在未来十年、二十年,完全想替代人类和医生是不可能的事情。但是我希望未来的十年、二十年,每一个医生都有一个人工智能的助手,科大讯飞的鹿晓亮表示。从基因应用来说,希望每个人拥有自己的健康管理顾问。

入门产业医学影像医疗健康深度学习生物医学医疗