Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱作者

押注长期价值,商汤如何打造「下一个时代的 AI 基础设施」

「当人工智能的发展走入深水区的时候,我们面临的不是 AI 解决不了问题,而是 AI 解决一个问题自身所花费的成本和代价,可能比带来的好处更多。这就是我们要解决的问题,商汤也给出了自己的答案。」在近日召开的 2022 中国算力大会上,商汤科技联合创始人杨帆说道。

过去十年,人工智能经历了第三次发展浪潮。这个由 1956 年达特茅斯会议提出的概念,终于等到了春天,在大数据和高性能算力的支撑下迎来了跨越式发展。但随着人工智能技术的产业化落地,一系列新的挑战逐渐浮现。


作为人工智能黄金十年的亲历者,商汤很早就开始思考一个问题:再往下走一步,AI 发展需要的又是什么?

从最顶尖的计算机视觉算法,到落地各行各业的 2 万个商用人工智能模型,再到 SenseCore 商汤 AI 大装置…… 当时代更需要通用、开放的、共享的基础设施,商汤义不容辞。

机器的猜想,人工智能的边界

2014 年 3 月,香港中文大学多媒体实验室自主研发的 DeepID 系列面部识别算法准确率达到 98.52%,在全球范围内首次超过人眼识别准确率,突破工业化应用红线。
为了探索计算机视觉算法商业化落地的更多可能性,2014 年 10 月,汤晓鸥和徐立、王晓刚、徐冰、杨帆等联合创办了商汤科技

商汤科技是第三次人工智能发展浪潮中的佼佼者,自成立以来,商汤在 AI 四小龙的营收规模对比中始终位居前列。八年间,商汤及联合实验室已在各学术顶会发表论文超过 700 篇,在各项竞赛中赢得超过 70 个世界冠军。

同时,商汤提出的上万工业级算法推动了人工智能技术在各行业、应用的持续落地,其中基于视觉算法的开源项目 OpenMMLab 目前在 GitHub 已经拥有超过 5 万 Star,并成功向研究者和业界开源上千个模型。

十年之间,人工智能技术演进带来的改变是颠覆式的,但瓶颈已现。在近日举办的 2022 中国算力大会上,商汤科技联合创始人林达华指出:「当人工智能进入各个行业的时候,我们发现整个生产链条很长。在很多场景下,响应每一个具体需求的成本和代价都是非常高昂的。如果想让人工智能成为未来国民经济发展的根本动力,我们需要突破一个新的红线——成本。」

另一个观察是,最近 40 年来,信息化技术一直保持高速发展,但整个人类基础科学的演进速度明显减慢。一些困扰了人类几十年的科研问题,还在等待关键性的突破。

商汤科技联合创始人、AI 大装置(AI 云)事业群总裁杨帆提到,纵观人类基础科学的发展史,真正驱动大量创新的,很多时候往往是超脱出归纳、超脱出推理的,也被称为「天才的脑洞」。机器或许能够做出类似的「猜想」,协助人类或代替人类推动整个科学体系的进步。


最近两年,一系列重大成果证明正在逐步证明「机器的猜想」的可能性,比如 DeepMindAlphaFold 已经拥有了预测蛋白质 3D 折叠形状的能力,破解了生物学界出现五十年之久的蛋白质分子折叠问题。此外,在物理、化学、天文、材料、生物、医药等等方面,人们都寄希望于 AI 带来更多的突破。

未来,AI 很可能会成为突破人类在科学技术发展中认知边界的重要武器。但这些全新的科研范式,以及动辄万亿参数的巨量模型,对今天的算力提出了非常巨大的需求。

杨帆认为,AI 再往下一步发展,必须由 AI 基础设施来提供大规模算力、算法、数据三要素的支撑,更加规模化、高效率、低成本地发挥技术本身的价值。

这个结论在众多的产业数字化场景中是成立的,AI 基础设施必须要像水和电一样平价,且要兼顾长尾场景的应用。数字经济时代的未来想象空间,全依赖于此。

因此,行业巨头纷纷投身于新一代 AI 基础设施的搭建之中,其中也包括商汤科技

打造下一个时代的 AI 基础设施

今天 AI 所需要的计算力和过去二十年的信息化、云服务已经大不相同。传统云服务提供计算,但存储占据了更大的比重。而 AI 基础设施中计算的占比远远大于存储,还要支持各种不同异构的硬件结构,更依赖专用的硬件和软件。

从 2019 年开始,商汤科技就着力打造通用人工智能基础设施——SenseCore 商汤 AI 大装置。凭借多年的核心技术积累、产业赋能沉淀以及开源生态建设,商汤已构建形成了集大规模 AI 算力、工业级 AI 算法、开放式 AI 平台与服务于一体的城市级 AI 超级计算平台。

SenseCore 商汤 AI 大装置

SenseCore 商汤 AI 大装置将计算基础设施、深度学习平台、模型层三个部分有机整合,可实现批量的算法模型生产、部署和迭代升级。

深度学习平台层,商汤科技的 SenseParrots 是国内最早自主研发的深度学习框架之一。SenseParrots 支撑千亿级别的大规模人工智能,能够同时调度超过 2000 块 CPU 为单一模型进行训练,加速效率超过 90%。

在模型层,商汤科技迄今已搭建超过 46000 个商用人工智能模型,将行业数周的开发时长缩短到几个小时,开发效率持续提升。商汤还联合多家知名实验室打造了 OpenMMLab、OpenGVLab、OpenDILab 等开源平台,目前全球范围内已有超过 110 个国家和地区的 100 多万用户正在使用这一开源体系。

在计算基础设施层,不同于传统云服务的数据基础设施,在帮助行业做智慧化转型的道路上,商汤选择了人工智能算力(Artificial Intelligence Data Center)的方向。

今年 1 月,投资 56 亿的商汤科技旗下人工智能计算中心 AIDC 一期项目在上海启动运营。

AIDC,亚洲最大的超算中心之一

作为 SenseCore 商汤 AI 大装置计算基础设施的重要组成部分和物理承载,AIDC 占地面积 13 万平方米,一期机柜数量 5000 个,一期工程的设计算力为每秒 3740 Petaflops(1 Petaflops 为每秒千万亿次浮点运算),是亚洲最大的超算中心之一。AIDC 的启动运营,进一步提升了 SenseCore 商汤 AI 大装置的模型生产效率。

SenseCore 商汤 AI 大装置是迄今为止国内最大的通用人工智能基础设施,也是商汤 AI 业务的基础,支持着商汤智慧商业、智慧城市、智慧生活、智能汽车四大软件平台的持续创新,以及在超大规模集群并行训练、蛋白质折叠研究等领域的前沿研究工作。



走到实体经济的深处去

在 2022 中国算力大会上,商汤科技宣布了一件大事:与山东省淄博政府共同打造「中国北方 AI 算力创新中心」。

围绕 AI 算力创新中心建设,商汤科技在论坛上宣布与淄博市人民政府达成战略合作。依托 SenseCore 商汤 AI 大装置强大的算力和算法能力支持,双方将在 AI + 新型智慧城市、AI + 智慧工业平台等领域开展深入合作,通过发挥商汤行业领先的技术与资源优势,推动「AI + 公共安全及社会治理体系、AI + 旅游、AI + 制造、AI + 智慧工业」等创新应用,营造富有活力的数字生态。

商汤科技与淄博市人民政府达成战略合作

凭借领先的原创 AI 技术能力以及对山东本地传统产业的深耕,商汤科技此前已成功助力山东智慧城市、智慧园区、智慧交通、智能遥感、智慧医疗、智能汽车等多产业发展,加速了 AI 与实体经济的融合,赋能地方经济转型升级。


以智能驾驶为例,青岛一汽依托商汤科技 AIDC 提供的强大算力支持,利用商汤深泉 AI 算法训练平台,对收集的大量冲压板材质量缺陷样本进行深度学习,生成专属算法模型。在实际生产过程中,通过检测工序中专用相机,预置相应的缺陷检测算法进行实时判断预警,有效提升了检测的稳定性和缺陷检出率。

商汤助力青岛一汽 AI 工业检测


2021 年底,商汤科技登陆港交所时,徐立曾说过:「先有持续的大规模技术投入带来创新,再有商业模式发展,这是一条罕有人走的路。」

在商业极具不确定性的时代,押注长期价值,的确需要更多的勇气。少有人走的路,不一定不正确,只是会辛苦一点。但在每一次时代更迭中,要想引领真正有价值的变革,没有一条路是不辛苦的。

从亚洲最大的人工智能软件公司,到赋能百业的 AI 大装置,商汤科技正在走向实体经济的更深处。
产业商汤科技
相关数据
商汤科技机构

作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,“以人工智能实现物理世界和数字世界的连接,促进社会生产力可持续发展,并为人们带来更好的虚实结合生活体验”为愿景,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。

http://www.sensetime.com
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
林达华人物

香港中文大学助理教授。研究兴趣:计算机视觉和机器学习。

汤晓鸥人物

汤晓鸥,现任香港中文大学信息工程系系主任,兼任中国科学院深圳先进技术研究院副院长。中央组织部“千人计划”入选者,全球人脸识别技术的“开拓者”和“探路者”,商汤科技联合创始人。2014年3月,汤晓鸥团队发布研究成果,基于原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力(97.53%)。

相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

遥感技术

遥感(remote sensing)是指非接触的、远距离的探测技术。一般指运用传感器/遥感器探测物体的电磁波辐射、反射特性。遥感通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

推荐文章
暂无评论
暂无评论~