Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

王艺、李泽南撰文微胖编辑

融了6亿美元后,汤晓鸥口中自负盈亏的商汤正在做什么?

「(商汤)自己自负盈亏,融了那么多钱,是要做更伟大的事情。」商汤科技联合创始人汤晓鸥在今天上午的 AI 峰会尾声时,告诉在座嘉宾和媒体。

从 4 月 25 日商汤科技人工智能峰会上发布的六款新产品不难看到,这家公司想要全面、加速进化为一家 AI 平台级公司的决心。

安防业务加速裂变

作为商汤的安身立命之本,「安防」仍是重中之重。

伴随着城市化快速的发展,整个城市的监控管理以及综合治理正在日渐成为一个极具挑战性的课题。

仅以深圳市为例,就有约 130 万个摄像头守卫着城市的安全,这个数字背后所蕴含的巨大规模与高度复杂的数据。如何快速地应用现代化的先进技术,有效提升城市的综合治理水平,是商汤一直以来努力的方向。

针对智能城市场景,商汤发布了「SenseFace 3.0 人脸布控实战平台」。

SenseFace 源自商汤起家的 DeepID,自 2014 年开始,商汤的 DeepID 算法第一次让机器的人脸识别能力超过了真人,在随后的几年中,随着需求的推动,商汤每年都把人脸识别的能力提高两个数量级。

升级到第三代的 SenseFace 人脸识别系统,能够实现大规模的黑名单布控。也就是说,一套后台系统能够同时对接几千路的视频,并对城市中的人流进行实时监控和报警。

商汤的人脸识别安防系统可以追踪并记录过去半年内特定人员的完整轨迹,结合公安的业务场景,这种技术可以提出多种公安业务优化方法。据商汤介绍,目前 SenseFace 已经投入实际应用阶段,在多个城市进行了千路级部署。

基于 SenseFace,商汤发布了「SenseFoundry 方舟城市视觉平台」,根据商汤的数据,SenseFoundry平台的人脸识别错误率在 E-11次方。只需8台服务器,SenseFoundry就能支持万路摄像头,并能够对1000亿级的数据进行搜索。

在方舟系统中,各类基于机器学习的服务被标准化,便于部署地更加高效地协同各种资源。目前这一平台还没有正式向合作伙伴开放。

布局未来计算平台:打造 AR 平台,做生态

「影响深远、创造卓越」,苹果公司 CEO 库克曾这样评价 AR 技术。

AR 仍被持续看好的原因在于,它在未来衍生出新计算平台的可能性,就像过去的 PC 台式机、移动互联时代的智能手机。

如今,商汤 AR 技术在短视频、相机、直播等 App 的亚太市场占有率 80%,年化增长速度 400%。小咖秀、Faceu、熊猫直播等大热 APP 的背后,都有商汤 SenseAR 技术的身影。

从 106 点基本面部捕捉,发展到 240 点,并加入了美妆效果,又发展了眼球跟踪、特殊 AR 游戏玩法等应用,今天,商汤再次升级了「SenseAR 增强现实感绘制引擎」。

这是一个全套的 AR 玩法渲染引擎,把 AR 效果从人脸延伸到肢体、手势等,为 AR 应用提供了更多的想象。例如实时改变身材、让虚拟形象跳舞,更精细的手部特效等。

这套引擎能够支持客户的原创 AR 技术,基于单目 RGB 摄像头即可满足不断增多的全身场景带来的 AR 玩法需求。

苹果拥有号称是世界上最大的 AR 开发平台,同样,作为一家平台级人工智能公司,商汤认为,只有自己在玩,不够。

接着,商汤又发布了「SenseAR 开发者平台」,希望与合作伙伴共同打造 SenseAR 平台以及 AR 生态,把 3D AR 技术推向教育、游戏、电商等各个场景中。

商汤表示,SenseAR 具有诸多优势。

首先,利用 SenseAR 开发者平台,硬件适配成本、应用开发成本、以及沟通维护成本都较低。

其次,SenseAR 支持 iOS、安卓、Windows、树莓派等操作系统。

第三,SenseAR 具备光照估计功能,地图的保存和恢复可以无缝连接,虚拟物体与任务的场景能够无缝融合。

最后,SenseAR 可以帮助智能设备理解 3D 空间。

商汤希望以技术优势吸引开发者的加入,打造以 SenseAR 底层引擎 + 手机厂商 + App 开发商 + 用户的商汤 AR 生态。

应景的「人文牌」:内容审核系统

如何利用现有先进技术更好地过滤不良内容,一直是内容聚合平台的挑战。今年年初,今日头条招募上千名内容审核员的新闻一度闹得沸沸扬扬。

商汤在现场给出了一组数据:一个内容审核师每天要看 5000 张图片,或 8 个小时的视频。如果一个应用每天有 100 万张图片,或 100 万条视频,可能需要 200 人甚至 2000 人的团队。

而完成这一工作量,商汤新产品——基于深度学习的内容审核系统 SenseMedia,只需一台 3 卡的服务器。

SenseMedia 能够过滤色情、暴力内容,且置信度较高,甚至能够区分裸体艺术品(如大卫雕塑)和色情图片。此外,系统采用高精度 OCR 技术,能够识别图像中的敏感文字,具有政治敏感人物和广告的过滤功能。

世界杯在即,商汤还基于 SenseMedia 发布了智能足球集锦系统。

人类编辑需要花费几个小时来制作的足球比赛集锦,使用 SenseMedia 就能迅速只能生成。SenseMedia 采用人脸识别和 OCR 技术识别并确定球星,寻找比赛中的精彩画面以及进球后的庆祝动作。

目前,SenseMedia 的合作客户包括探探、酷狗音乐、小米视频、Hasrdaily、美图秀秀、TCL、东方明珠、阿里云等。

自动驾驶领域的第二个动作:驾驶员监控系统

继 2017 年末与本田宣布合作自动驾驶技术后,今天商汤又发布了 SenseDrive DMS 驾驶员监控系统。

具体来说,通过深度学习技术和嵌入式芯片优化技术结合,该监控系统能够对驾驶员疲劳及注意力分散等行为进行监测,例如睁闭眼、打哈欠、视线偏移、分心等。

SenseDrive DMS 支持人脸识别、视线方向、眨眼检测、动作识别,而这些技术能力只需配备普通的 IR 摄像头、芯片和商汤的 DMS SDK 即可构建。

其中,商汤的 DMS SDK 也不需要 GPU 支持,在 CPU 及嵌入式系统芯片上均可实时运行,为厂家节省更多费用,也是这款系统的一大亮点。

商汤表示,系统对驾驶员注意力分散行为及疲劳行为监测的准确度已超过 98%,且具有较强的鲁棒性,在侧脸,弱光、年龄变化、戴眼镜等情况下同样能正常监测。

此外,SenseDrive DMS 还能防止车辆被盗,综合保护人身安全并减少财产损失。

不过,通过面部识别技术来检测驾驶员情况,并不算是新鲜事。

比如,一家名为 Affectiva 的人工智能初创公司,就把情绪识别技术用于自动驾驶领域,在今年年初发布了一款人工智能情绪监控软件(emotional AI software)。这套人工智能系统可以追踪驾驶员的情绪、体能及驾驶分神的程度。车企可将面部识别技术及语音追踪技术纳入到其未来的新车型中。

6 亿美金天价融资,商汤做对了什么?还要做什么?

技术、场景、人才,是商汤在这三年来做对的三件事。

技术方面,商汤建起了全中国最大的深度学习超算中心,目前拥有超过 8000 块 GPU,并摆脱 Tensor Flow、Caffe 等开源框架,自主研发了原创深度学习平台 Parrots。

场景方面,商汤走「1+1+X」战略。其中,第一个 1 代表研发,第二个 1 代表技术产业化,而 X 则代表着「赋能百业合作伙伴」。

目前,商汤已经在安防、金融、智能手机、移动互联网、汽车、零售等多个垂直领域均有布局。

已与超过 400 家国内外知名企业建立合作,包括美国麻省理工学院、Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、京东、华为、小米、OPPO、vivo、微博、科大讯飞等。

人才方面,商汤的核心团队具有 20 年的科研经验。目前,商汤科技拥有 800 余位技术研发人员,其中 150 余名为来自世界名校的人工智能博士。

面向未来,商汤表示,在获得了本次 C 轮融资后,将从产业链构建、加大头部伙伴战略捆绑、深化向原创技术各个行业辐射等方面,全面加快向 AI 平台级公司进化进化为一家 AI 平台级公司以原创技术为基础,借助核心平台化能力多元赋能多个行业。

除了上述技术、场景和人才方面的布局,商汤还在以投资的方式打通产业链上下游。

去年 12 月,商汤联合领投了房地产 VR 领域的头部企业 51VR,标志着商汤开始布局自身 AI 产业战略投资。本次 C 轮融资以后,商汤也会加大对类似 51VR 等 AI 上游场景应用初创公司的投资,进一步加速商汤自身 AI 能力在更多场景的落地。

产业
11
太牛啦