腾讯医疗AI实验室正式亮相 开辟视频分析AI辅诊新领域

「医疗」和「政务」两大方向是腾讯 AI to B 业务的重要发力点。

「觅影」之后,腾讯针对 AI 医疗领域再布一棋——腾讯医疗人工智能实验室首次亮相,方向瞄准 AI 视频分析与自然语言理解,将驱动腾讯医疗业务进一步深化。

相比百度和阿里,腾讯的 AI 战略布局时间谈不上早。但在技术方向和产业落地层面,腾讯的「产品导向」和强调落地的思路为其找到了精准的切入口。

「医疗」和「政务」两大方向是腾讯 AI to B 业务中重要发力点。在股价持续走低的背景下,业务线的走向将成为「未来是否可期」的最先征兆。

谈到腾讯 AI,「觅影」常被马化腾及腾讯高管在重要场合提及,它是腾讯首次将 AI 应用到医学领域的尝试,基于医学影像分析技术在辅助医生筛查食管癌、肺结节、宫颈癌等领域均已落地。

更为重要的是,腾讯凭借医疗影像项目成为了首批国家级新一代人工智能开放创新平台。科技部表示,「国家医疗影像新一代人工智能平台将依托腾讯组建」。

该项目为腾讯在 AI 和医疗领域均树立了不俗的公信力,快速在三甲医院和地区医院建立市场。

在强调 B 端转型之后,医疗与 AI 结合对于腾讯的意义自然不言而喻。近期,腾讯针对 AI 医疗领域再布一棋——腾讯医疗人工智能实验室(以下简称「医疗 AI 实验室」)正式亮相,但腾讯并未过多强调这点,同期活动的宣传方式也较为低调。

在香港举办的 2018 年第 22 届国际帕金森及运动障碍大会期间,腾讯宣布实验室将以帕金森领域的 AI 辅诊作为重点项目方向之一,并在全球范围内展开研究与合作。

为何推出医疗 AI 实验室?

「医疗 AI 实验室」,在名称的设定上——医疗在前,人工智能在后,不同于一般「AI 医疗」的说法,能够在一定程度上看出团队对于产业的聚焦程度。

活动现场,实验室领队——负责人范伟首次面向媒体,腾讯并未过多介绍其背景。据社交网站 LinkedIn 显示,范伟毕业于清华大学计算机系,并于 2001 年在哥伦比亚大学获得计算机科学博士学位。范伟曾先后在 IBM 华讯研究院、华为诺亚方舟实验室、百度大数据实验室工作,加入腾讯前作为百度大数据实验室(BDL)主任。

范伟介绍,腾讯医疗 AI 实验室成立于 2017 年 9 月,硅谷、北京、深圳均设有实验室。团队覆盖机器学习、计算视觉、视频分析、AR 、自然语言理解等领域人才。

在被问及实验室的研究领域时,腾讯医疗 AI 实验室负责人范伟并没有直接回应,而是强调实验室的使命就是要解决问题。他表示,全球名列在册的疾病有 2000 多种,不同疾病种类和攻克方式各有不同,这其中大有可为。

切入医疗产业时,腾讯除了推出腾讯觅影等医疗 AI 项目,还将就医流程优化项目、微信医保支付、微信新农合支付等产品打包作为「互联网+智慧医院」解决方案。

看起来,腾讯在整个医疗产业的布局和落地更像是「互联网医疗工具+移动医疗+医疗 AI」的综合性产物。思路沿袭腾讯「互联网+」战略,即成为「工具箱」和「连接器」,这个概念在 2015 年被提出。

今年 9 月,马化腾介绍了腾讯将 AI 应用在医疗领域的两条路径。他谈到:一个是 AI 医疗影像处理,我们推出了腾讯觅影,运用计算机视觉深度学习技术,对各类医学影像进行学习训练,目前已经在早期食道癌、宫颈癌、肺癌、乳腺癌等领域,辅助医生进行高效、精准的诊断与筛查;另外一个方向是 AI 辅诊,目前我们的智能导诊技术,可以根据医院需求定制,缓解医院导诊的压力。

基于视频分析技术的 AI 辅诊作为新的一条路径方向,进一步说明腾讯在医疗 与AI 结合上的空间性和想象力。

对于为何成立一年多才面向媒体,范伟表示,「我们比较低调,希望有一定进展时才走到前边来。」

第一步,定义一个「好问题」

在研究领域,定义清楚一个问题往往比解决问题更重要。对于腾讯医疗 AI 实验室而言,这个问题已经明确——「将视频分析技术用于运动障碍症领域的研究。」其中,帕金森病属于最具代表性的运动障碍病症之一。

帕金森病(Parkinson's disease,PD)是一种慢性进行性神经变性疾病,又叫震颤麻痹,已经成为全球第三大「老年病」,但近年来有明显向年轻群体蔓延的趋势。我国目前帕金森病患者人数已超过 200 万。症状体现为静止性震颤,最明显的表现就是手抖;肌强直;运动迟缓等。

比较遗憾的是,帕金森病迄今为止尚无有效治愈方法,常规的治疗手段包括定期鉴别诊断和临床随访,根据量表分析等判断病情阶段进行针对性的药物治疗、手术治疗等。

活动当天,腾讯宣布与英国移动医疗公司 Medopad,帕金森病领域知名专家、英国伦敦国王学院教授 Kallol Ray Chaudhur 达成合作,共同推进帕金森病临床及应用领域的 AI 辅诊技术联合研发,目标在于实现帕金森病临床评测标准的运动功能 AI 辅助评估技术在移动化、家庭场景下的应用,利用智能手机即可进行快速智能运动功能评估。

现场 Demo 演示中,一名英国籍帕金森病人正坐,左右手分别摆出拇指与食指合拢、张开动作,这是 UPDRS/S/MDS-UPDRS(国际普遍采用的帕金森氏病评分量表) 中指定动作中的一部分,通过人工智能视频分析技术,左屏的图表中同步显示该患者左右手手指动作的捏合幅度、捏合频率变化,可以用量化的方法明确展示出该患者左右手手指捏合频率的不同。

范伟介绍说,基于该视频分析得到的结果能够远程获得患者当下的运动评估结果,减轻患者往返就医的负担和时间,同时也减少医生的工作量。

基于视频分析进行帕金森 AI 辅诊,前期需要大量运动障碍患者运动视频数据。范伟谈到,在前期有限的样本量情况下,团队基于 AI 和 AR 技术结合模拟衍生出更多的运动视频仿真数据来进行训练,「例如,手有很多细节,我们的技术对于两种数据都同样可以自动识别出一只手的21个关键节点,并用于手部姿态分析。」

项目在复旦大学附属华山医院进行临床预试验,AI 诊断结果与专家结果的一致性曲线。范伟介绍,在该实验中,采用双盲以及非常严格的数据标准。

基于腾讯医疗 AI 实验室与华山医院的合作,腾讯还推出了一款通过动作检测、评估帕金森症的 AI 模型——帕金森病运动功能智能评估系统。

评估过程中,患者无需穿戴任何传感器,仅需站在摄像头前,按照指示完成一系列的动作后,系统在手机到合规视频数据后3分钟内分析并完成视频分析并给出帕金森病的运动评估。腾讯介绍,这将辅助医生将诊断速度提升10倍,此项技术填补了帕金森运动功能辅助诊断的国内外空白。

该方案被视为视频分析在帕金森病领域的首次尝试,技术方案和路径也是国际学术方向上少有的。既然是首次,自然也不乏异议。活动现场,一名来自日本的医疗学者便提出,通过动作视频的分析和监控无法识别到细微或者被挡住的动作。

范伟表示,目前该项应用的确没有加入这个部分的功能,只是适用于指定动作的评分和量化。

一般看来,在于讲究精准和安全性的医疗领域,传感器监测自然是比机器视频分析更优质的数据源,那么腾讯为什么要选择后者?

范伟表示,医疗监控设备和传感器的应用场景存在限制,如果需要监控到手部 21 个关键点的活动数据,可能就需要佩戴十多个、甚至更多的传感器,这在家庭环境中很难实现。即使在医院里,光是为上肢穿上所有的传感器就需要半个小时,成本也很高。

在医学研究领域,需要对测试者进行持续性监控才能判断该疗法和药物是否有效,如果对应地的方案是需要患者 24 小时佩戴感应器基本是很难实现。

该项目在海外将与英国伦敦国王学院医院的 Kallol Ray Chaudhuri 教授进行合作,帮助患者在家庭等医院外的环境监控和跟踪病症。

Kallol Ray Chaudhuri,是世界知名帕金森领域专家、运动障碍教授兼伦敦国王学院医院帕金森综合诊断主任,核心研究方向为非运动障碍表现的帕金森研究。他对于互联网技术用于医学研究兴趣盎然,「在医疗与健康领域,『科技技术』绝对是热词,只要有可能,我们就会把技术应用在这些领域」。

Ray 表示,在癌症、糖尿病等常见病种都已经投入新兴治疗和监控方式的当下,帕金森却仍采用陈旧的量表对照分析方式不够合理,因为不同的医生在进行评分时可能出现将较大的误差和不一致性。通过引入视频分析和机器评定的方式能够在一定程度上提升诊断的客观性和一致性。

项目落地路径

长远来看,腾讯医疗 AI 实验室的项目将基于视频分析和自然语言理解两大基础能力展开。

范伟介绍,团队将在自然语言理解技术用于分析和理解医学文本资料,可以提取出文本中的病症描述、医疗方案、临床结果等结构化数据,还可以建立多重索引的权重排序。

此外,全天 24 小时的心脏监控在今年晚些时候将进行临床试验。沿帕金森病症研究的思路,腾讯还将把视频分析技术用于其他运动障碍患者的能力评估,包括中风患者的早期预测、治疗恢复不同阶段的运动视频分析;脑瘫、脊椎侧弯等疾病患者的运动能力评估。

对于首个帕金森症的研究,范伟表示,现阶段还处于小规模的临床测试阶段,与华山医院的合作为后续推广到大样本实验提供了非常多的思路和经验。落地时间方面,仍然一切以「安全、有效」为准,将采用最严苛的标准来审核其方案的可行性。

相比百度和阿里,腾讯的 AI 战略布局时间谈不上早。但在技术方向和产业落地层面,腾讯的「产品导向」和强调落地的思路为其找到了精准的切入口。

产业腾讯医疗人工智能应用AI 实验室
相关数据
人工智能技术
Artificial Intelligence

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

大数据技术
Big data

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

计算机视觉技术
Computer Vision

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

机器人学技术
Robotics

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

权重技术
Weight

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

推荐文章