人体分析技术,了解一下

《碟中谍6:全面瓦解》下个月在全球上映,暑期档又有大片看了!据说,片中除了阿汤哥跳楼、爬飞机、掉崖、雪山坠机等惊险刺激场面,也有不少人脸识别、声波分析仪、热敏仪等先进技术的应用,各种命悬一线、手心冒汗,是不是很期待?

其实,这些美国大片中的标配场景早已成为现实:在安防监控领域,人流监测、行为识别等技术的应用,可以帮助城市管理者快速发现人群中的异常行为,及时作出预警和管控。不仅如此,类似的技术也正在应用到零售行业,由此衍生出的客流量统计、顾客轨迹分析等应用,可以帮助运营者更好地进行门店选址、精准营销和货品陈列。

类似的应用场景和技术还有很多,它们是百度 AI 人体分析服务的一部分。作为百度在人工智能领域的新成员,人体分析都有哪些技术特点和功能特性,可以应用到哪些场景呢?了解一下~

 有哪些核心能力? 

百度人体分析基于深度学习,准确识别图片或视频中的人体相关信息。

提供人体检测与追踪、关键点定位、属性分析、人流量统计、手势识别等能力。

人体关键点识别——检测人体的14个主要关键点,包含四肢、脖颈、鼻子等部位,支持多人检测、俯视视角、动作变化等复杂场景。

人体属性识别——可以识别人体静态属性和行为动作,包含性别、年龄段、衣着、配饰、身体朝向、是否使用手机等数十种属性。

人像分割——主要识别人体的轮廓范围,以便与背景进行分离,可应用于拍照背景替换、照片合成、人体特效等场景。

手势识别——能够精准识别数十种手势,包括 OK、手掌、食指、拳头、比心等,支持动态手势识别,在手势特效、智能家居手势交互等场景应用潜力很大。

人流量统计——可针对人流密集场景,统计人体个数和流动趋势,以俯拍角度为主要识别视角,准确率可达90%以上,支持特定框选区域的人数统计。

驾驶行为分析——针对车载场景,检测图像中是否有驾驶员,并识别驾驶员使用手机、抽烟等动作,分析预警危险驾驶行为。

最终,百度人体分析的这些能力,都将通过 API、SDK、软硬一体产品等形式提供服务。先不说服务的内容和形式,单纯这些能力本身就已经蕴含了巨大的潜在价值:比如,人像分割可以用在休闲娱乐或者电影拍摄上,手势识别则有助于提升人机交互的效率和质量,人流量统计可以为公共安全管理提供帮助。

 有哪些应用场景? 

在今年的世界杯上,VAR(Video Assistant Referee,视频助理裁判)似乎成为新主角,尤其在主裁判无法准确作出判决时,VAR 技术能有效减少主裁判的误判,更大程度上让每一场比赛都公平公正。而相比较 VAR 技术在判决中的应用,人体分析在体育娱乐中的应用意义更大。

在体育娱乐领域 ,可以基于人体关键点信息,分析质点运动轨迹、动作角度等,辅助运动员训练,提升教学效率。比如,在足球训练中,人体分析的应用,不仅可以帮助提高自身球队的能力,也能帮助球队仔细研究对手,帮助教练制订更加科学有效的战略战术。而在娱乐互动领域,人体分析的运用则可以进一步增强互动,比如增加身体道具、手势特效、体感游戏等互动形式,丰富娱乐体验。

在安防监控领域 ,人体分析更是将现实版的“碟中谍”演绎得淋漓尽致。通过对人体的实时定位追踪,不仅可以监控人流量,及时预警局部区域人群过于密集等安全隐患,还能对危险、违规等异常行为进行识别,从而做到及时管控,对于提升公共安全有着明显的促进作用。

在智慧零售领域 ,人体分析无疑将为“新零售”提供新的注解。过去,客流统计、顾客轨迹分析等,都靠专人蹲守统计,效率低不说,准确率也会差很多。而有了人体分析技术,商场、门店出入口的流量数据可以及时有效地进行统计收集,消费者的行为轨迹也可以更加准确的记录下来,甚至,人群的属性特征也能够进行清晰的画像;这样一来,客群导流、精准营销等传统零售难以做到、难以做好的部分将得到大大改善。

在驾驶监测领域 ,当司机有接打手机、抽烟等影响驾驶的行为出现时,系统通过对驾驶员行为的识别,可及时进行预警和提醒,大大降低事故发生率;同时,人体分析也可以对乘客进行分析,通过对车内乘客数量的统计,得出空座和超载情况的分析,从而避免超载、提升安全性。

事实上,这些还只是人体分析应用的冰山一角,在不同行业、不同领域,还有更多我们意想不到的应用场景适用于人体分析技术。为了拓展更多人体分析的垂直服务,为更多的行业应用场景提供细分解决方案,百度人体分析依托百度 AI 开放平台已经向合作伙伴开放。

在这个开放的生态中,百度人体分析负责持续丰富人体识别能力、深入训练人体分析模型,并打造软硬一体的灵活易用解决方案;合作伙伴则负责更多应用场景的拓展以及打造与之相匹配的硬件产品,将人体分析技术落地应用。可以预见的是,未来人体分析的应用将会深入到各行各业中,为我们的工作和生活带来全新的升级。

百度AI
百度AI

入门人体分析技术
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~