Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

认知系统专委会作者

历史首次!华人博士获IEEE THMS 汇刊最佳期刊论文奖

齐雯博士和苏航博士获得 IEEE Transactions on Human-Machine Systems 的 Andrew P. Sage 最佳论文奖。

2021 年 IEEE 系统、人与控制论学会(IEEE SMC)旗下的 IEEE Transactions on Human-Machine Systems 期刊 Andrew P. Sage 最佳论文奖 (Best Transactions Paper Award) 公布,意大利米兰理工大学电子、信息和生物工程学院齐雯博士和苏航博士凭借论文《A Smartphone-Based Adaptive Recognition and Real-Time Monitoring System for Human Activities》摘得该奖项。这是自 2014 年颁布以来,华人首次获得该期刊最佳论文奖。Andrew P. Sage 最佳论文奖每年在 IEEE SMC 学会出版的每个汇刊中各遴选一篇论文授予该奖励。


此外,论文作者还包括米兰理工大学电子、信息和生物工程系 Andrea Aliverti 教授。

图片

论文地址:https://ieeexplore.ieee.org/document/9078047

获奖论文介绍

1.   研究背景

使用智能手机的人类活动识别 (HAR) 为远程医疗提供重要的医疗保健指导和长期治疗。机器学习深度学习(DL) 技术被广泛用于科学研究人类行为的统计模型。然而,表现现有的 HAR 平台受限于复杂的身体活动。该工作提出了一种自适应识别和实时人类活动监测系统 (Ada-HAR),有望在动态情况下识别更多人体运动。Ada-HAR 框架引入了无监督的在线学习与类约束的数量无关的算法。此外,采用的层次聚类和分类算法标记和分类 12 个活动(五个动态,六个静态和一系列转换)自主。最后,实用已经进行了实验以验证其有效性和所提出算法的鲁棒性。与方法比较文献中提到,结果表明基于 DL 分类器获得更高的识别率(95.15%,腰部和 92.20%,口袋)。基于决策树的分类器是最快的模态演化方法。最后,Ada-HAR 系统可以实时监控人类活动,无论方向如何的智能手机。

使用惯性传感器识别人类活动的智能手机吸引了越来越多的研究兴趣,在过去的几十年里,在各个领域,从家庭医疗保健到运动监测、康复、个性化医学和精神障碍近年来,随着物联网、机器学习(ML)、深度学习 (DL) 技术、人类活动识别 (HAR)可以通过在体域网中传输数据来实现和无线以太网,允许评估人类身体和生理状态。然而,许多研究通过求助于给定的 HAR 系统开发适当的任务到广泛的启发式知识。它们适用于实验室或通过身体固定移动控制良好的情况设备。移动干扰的可变性设备会影响 HAR 系统的识别率,例如运动伪影、基线噪音、新活动的发生以及用户之间的差异。例如,识别老年人和年轻人的相同行走状态具有挑战性。精心设计的特征很难建模错综复杂的活动细节并且非常耗时。因此,它是有趣的是引入一个自适应分类器来识别动态情况下的活动。

图片

图 1:Ada-HAR 通信系统示意图。在 “个人监控” 单元中,可以通过携带智能手机已经安装了带有建议算法的软件。在 “本地监控” 单元中,人们可以通过分析用户的活动来监控用户的活动。从 Wi-Fi 网络接收数据。在 “远程监控” 单元中,可以通过多点无线接收信号来监控预测的活动桥接网络。

2.   创新点

该工作提出了一种基于智能手机的自适应 HAR 实时监控系统 (Ada-HAR) ,该系统可以识别 12 个人的活动。其中包括:
  • 五个动态练习(步行、慢跑、跳跃、上楼、下楼);

  • 七个静态姿势(站立、坐着、左右躺着,俯卧位和仰卧位);

  • 一系列转换(例如从坐到站立)。

该系统旨在标记原始信号,通过使用分层 k-medoids 聚类自动(Hk-mC) 算法并构建层次分类 (HC) 用于 HAR。最后,开发的 Ada-HAR 系统经过一组受试者的验证,用于监测人类远程和本地 LAN 中的活动。

 Ada-HAR 系统主要贡献概述如下:
  1. 它可以在动态情况下更新先前的分类器;

  2. 数据压缩方式,实现快速计算;

  3. 所提出的信号处理方法避免了位置和方向变化的干扰。


3.   实现方式

图 2 为建议的 Ada-HAR 系统,包括创建、识别和在线学习模块。
  • 创建模块:采用 Hk-mC 自动标记活动。HC 算法用于建立识别 12 个原始活动的分类器;

  • 识别模块:通过在腰部携带智能手机或将智能手机放在左侧裤兜中,实时对 HAR 的 HC 分类器;

  • 在线学习模块:将以无监督学习方式确定 12 项原始活动中未包含的新活动。同时,对旧分类器进行更新。信号预处理和特征提取模型在创建和识别模块中共享。

图片

图 2:Ada-HAR 系统的数据流:包括训练(蓝线)、测试(橙线)和更新(浅棕线)程序

图片

图 3:信号预处理模型示意图

图片

图 4:标注的带固定活动编程的三轴加速度

图片

图 5:带有固定活动编程的三轴加速度标记

4.   实验结果

该研究提出了一个基于智能手机的人类活动自适应识别和实时监控系统(Ada-HAR)。对 25 名受试者进行了实验,以验证所开发系统的性能。最具创新性的部分是在线学习算法,它能够在动态环境中更新分类器,这意味着如果发现任何新活动,HC 分类器将自动更新以包含新类。它是一种无监督的在线学习算法,不需要获得真正的标签。除了自适应算法外,使用 Hk-mC 算法的自动标记方法是提高原始信号标记效率的另一个原始成果。实验通过将智能手机放在不同的位置和不同的方向来证明它的鲁棒性。引入的信号预处理策略为分类器提供了稳定的输入,而不考虑智能手机位置的变化。

结果表明,基于 DL 的 HC 分类器对 12 项原始活动(95.15% 的腰部和 92.20% 的口袋)的分类准确率较高。此外,基于 k-NN 和 DT 算法的 HC 分类器更新之前的 HC 分类器以识别新类所需的时间更少。与 SOTA 方法相比,Ada HAR 系统不仅在活动数量方面,而且在识别精度方面都有了改进。

图片

图 6:基于 K-NN、DT、NB、ANN、SVM 和 LSTM 的 HC 分类器的比较结果

图片

图 7:新活动预测结果的比较。这三个图是两个方向的三轴加速度、由五个基于 ML 的 Ada-HAR 系统计算的在线精度和在线预测时间。实线和虚线是压缩和未压缩的数据集。底部图表中的脉冲点是 HC 分类器重新训练的位置。(a) 将智能手机放在腰部蹲下。(b) 把智能手机放在口袋里蹲下。(c) 将智能手机放在腰部,扭动腰部。(d) 将智能手机放在口袋里,扭动腰部。

图片

图 8:ADA-HAR 系统五种 ML 算法的最终精度和总测试时间对比

未来研究者将考虑更多的活动,甚至在更复杂的情况下进行挑战。此外,该研究将在各种可穿戴设备上进行验证,以提高其识别能力。齐雯博士还希望将 Ada-HAR 系统的性能与一些商业 HAR 平台进行比较。 

文献引用:

Wen Qi, Hang Su, and Andrea Aliverti. A Smartphone-Based Adaptive Recognition and Real-Time Monitoring System for Human Activities, IEEE Transactions on Human-Machine Systems, 50(5), 414-423, 2020.  

齐雯博士简介:

图片

齐雯博士 2020 年初毕业于意大利米兰理工大学,主要从事可穿戴医疗设备算法架构,深度学习人机交互方向的研究。第一作者论文 2021 年获得 IEEE 系统、人与控制论学会旗下 IEEE Transactions on Human-Machine Systems 期刊的 Andrew P. Sage 最佳论文奖(Best Transactions Paper Award),获得两个国际期刊年度封面论文、2020 IEEE ICARM 先进机器人学最佳论文奖、2014 IEEE WCICA 和 2021 IEEE ICARM 最佳论文入围奖。长期在海外从事多项欧盟及校企联合项目。其作为米兰理工大学呼吸分析实验室唯一的深度学习算法方向博士,独立完成了与全球最大的移动电话运营商 - 沃达丰公司合作的欧盟 5G 远程呼吸健康监控 5G trial 项目。

苏航博士简介:

图片

苏航博士 2019 年毕业于意大利米兰理工大学,长期从事机器人控制与应用、人机交互、遥操作等研究。担任 Frontiers in Neuroscience(中科院二区),Frontiers in Neurorobotics(中科院三区),ICRA/IROS/ICARM/ ROMAN 等多个 IEEE 旗舰会议的编委,IEEE TFS, IEEE RAL, Complexity, Actuators 等期刊的客座副主编。担任 IEEE ICARM 2021/2022 大会程序委员会主席,IEEE ICDL 2023 大会组织委员会主席,IROS 2021 控制和机器人数据应用的两个分会主席,IEEE ICARM 2020 分会主席,并多次牵头组织机器人国际交互研讨会(IROS 2020, ICARM 2020, ROMAN 2020)。2021 年获得 IEEE 系统、人与控制论学会旗下 IEEE THMS 期刊的 Andrew P. Sage 最佳论文奖(Best Transactions Paper Award),第一作者论文 2020 年获 IEEE ICARM 2020 先进机器人学最佳会议论文奖,获 2021 年 IEEE ICARM 最佳会议论文提名奖, 获 2019 年 ICRA 旅行奖。

Andrea Aliverti 教授简介:

图片

Andrea Aliverti 为米兰理工大学电子、信息和生物工程系 (DEIB) 的教授,教授传感器、仪器技术以及呼吸系统生物工程内容,并且是生物工程博士项目主席。主要负责 DEIB 生物医学技术实验室 (TBM-Lab) 的 Lares(呼吸分析实验室)。他的主要研究兴趣包括呼吸系统的生物工程、生理测量、功能肺成像、生物医学仪器和传感器,特别是开发通过可穿戴传感器和人工智能连续监测生理变量的新方法。
工程
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

统计模型技术

统计模型[stochasticmodel;statisticmodel;probabilitymodel]指以概率论为基础,采用数学统计方法建立的模型。有些过程无法用理论分析方法导出其模型,但可通过试验测定数据,经过数理统计法求得各变量之间的函数关系,称为统计模型。常用的数理统计分析方法有最大事后概率估算法、最大似然率辨识法等。常用的统计模型有一般线性模型、广义线性模型和混合模型。统计模型的意义在对大量随机事件的规律性做推断时仍然具有统计性,因而称为统计推断。常用的统计模型软件有SPSS、SAS、Stata、SPLM、Epi-Info、Statistica等。

数据压缩技术

数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。数据压缩包括有损压缩和无损压缩。在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元(或者其它信息相关的单位)表示信息的过程。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

噪音技术

噪音是一个随机误差或观测变量的方差。在拟合数据的过程中,我们常见的公式$y=f(x)+\epsilon$中$\epsilon$即为噪音。 数据通常包含噪音,错误,例外或不确定性,或者不完整。 错误和噪音可能会混淆数据挖掘过程,从而导致错误模式的衍生。去除噪音是数据挖掘(data mining)或知识发现(Knowledge Discovery in Database,KDD)的一个重要步骤。

层次聚类技术

层次聚类通过对数据集在不同层次进行划分,从而形成树形的聚类结构。数据集的划分可采用“自底向上”的聚合(agglomerative)策略,也可采用“自顶向下”的分拆(divisive)策略。“自底而上”的算法开始时把每一个原始数据看作一个单一的聚类簇,然后不断聚合小的聚类簇成为大的聚类。“自顶向下”的算法开始把所有数据看作一个聚类,通过不断分割大的聚类直到每一个单一的数据都被划分。

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

在线学习技术

在计算机科学中,在线学习是一种机器学习方法。和立即对整个训练数据集进行学习的批处理学习技术相反,在线学习的数据按顺序可用,并在每个步骤使用未来数据更新最佳预测器。

控制论技术

控制论是一门跨学科研究, 它用于研究控制系统的结构,局限和发展。在21世纪,控制论的定义变得更加宽泛,主要用于指代“对任何使用科学技术的系统的控制”。由于这一定义过于宽泛,许多相关人士不再使用“控制论”一词。 控制论与对系统的研究有关,如自动化系统、物理系统、生物系统、认知系统、以及社会系统等等。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

活动识别技术

活动识别旨通过对代理人的行为和环境条件的一系列观察来识别一个或多个代理人的行为和目标。

暂无评论
暂无评论~