Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部报道

360视觉大模型重塑AIoT,智慧生活给周鸿祎「交卷」

5 月 31 日,360 智慧生活视觉大模型及 AI 硬件新品发布会在京召开。发布会以 “安全守护、智见未来” 为主题,推出了 360 智脑・视觉大模型及多款 AI 硬件新品,并宣布 360 智慧生活正式进军 SMB 市场,实现了从家庭场景到企业商用的大步跨越。

不久前,360 集团创始人周鸿祎曾在全员信中要求 “全面拥抱人工智能” 并给公司所有产品经理和工程师 “留作业”,以大模型能力重塑全线产品。今年 4 月,360 智脑加持的浏览器和搜索产品开放内测,今天这场发布会便是 360 智慧生活交出的一份新答卷。

近年来,随着人工智能技术的发展,传统深度学习算法在安防场景中的局限性愈发凸显。算法通用、场景不通用,无法以较低的边际成本解决场景碎片化的问题,同时针对边端算法受限、内存受限等问题也限制了 AI 的进一步普及与落地,相比之下,大模型则有着更好的泛化能力,有望进一步突破传统算法的精度与数据局限,也能解决传统深度学习算法的数据依赖问题,在此基础上不仅能够降低训练研发成本,还可实现在垂直场景中的快速落地。可以很好的弥补传统深度学习算法的局限。

当前,多模态能力的增强核心主要是借助大语言模型的认知、推理、决策能力。于是,360 智慧生活将视觉感知能力与 360 智脑大语言模型相结合,并针对安防场景做行业数据微调,打造出了专业的视觉及多模态大模型 ——360 智脑・视觉大模型。

据 360 视觉云业务线总经理孙浩介绍,360 智脑・视觉大模型现阶段主要聚焦开放目标检测(OVD)、图像标题生成、视觉问答(VQA)三项能力。其中,开放目标检测是通过学习互联网上海量的图文对数据,让模型能够融会贯通的学习到更多的目标类别;图像标题生成,是理解图片的一种高级形式,能够满足用户快速准确获取信息的需求;视觉问答,则是基于对图片的识别、理解、推理,回答使用自然语言提出的各种问题。这三项能力可以在长尾目标检测、巡店、看护、设备巡检等场景中实现广泛应用,能对传统深度学习算法形成很好的补充。

不过,安防场景的落地,还需依赖于大小模型协同、端边云融合。其中,小模型可以作为样本价值判断,帮助大模型快速学习与收敛;大模型则可基于知识蒸馏,将能力快速传递给小模型,可以帮助小模型快速生成、标记样本,提升效率。

在 AI 的落地应用上,360 智慧生活已经有多年的探索,去年推出了以场景化 AI 为核心的智能安防 SaaS 平台 ——360 视觉云。360 视觉云不光承接了 AI 算法以及后续视觉大模型的落地,还针对中小微企业提供了全套的智能安防解决方案。目前,360 核心智能安防产品,均已接入 360 视觉云,可以在同一场景中无缝衔接,从而形成数据可视化解决方案。其中,AI LAB 更是能够有效解决边、端算法的场景化适配问题。而搭载 360 智脑・视觉大模型的 360 视觉云,不仅拥有 50 + 的场景算法可供选择,还可实现算法运行容器化、场景适配规则化、技能与检测结果可视化,尤其适合中小微企业的数字化转型与安防能力建设。

众所周知,中小微企业在数字化转型过程中面临着投入过于高昂、产出难以衡量、安全缺乏保障等难题。而 360 视觉云原本就具备交付门槛低、配置方式低、技术难度低、操作难度低、使用成本低等优势,搭载 360 智脑・视觉大模型后,更是能够加速推动硬件产品的 AI 普惠升级,让安防产品真正走入平民化的智能时代。

在本次发布会上,360 智慧生活还以 “普惠 AI,焕新升级” 为主题,发布了 360 户外球机 6 Pro、360 炫视户外枪球一体机、360 双目拼接全景摄像机、360 炫视智能 NVR 等新品,实现了从室内到室外、从家用到商用、从线上到线下,场景渠道全覆盖。在 360 智脑・视觉大模型的赋能下,这些产品拥有更强的边缘计算能力,能够实现更加广泛的兼容,从而适配不同的应用场景。

从 360 智脑・视觉大模型的发布到安防产品的全线升级,360 智慧生活迈出了 AI 大模型时代的关键一步,并携全面升级后的 360 智慧生活产品正式进军 SMB 市场。未来,360 智慧生活将继续深耕智能安防前沿领域,探索 AI 大模型在安防场景中的应用,用普惠 AI 赋能中小微企业的数字化升级。

此次发布会上,周鸿祎表示,智能硬件将成为大模型发展的下一个风口,大模型将带来智能硬件进入 AIoT 时代。正是基于这样的判断,360 智慧生活总裁王汝林揭晓了全新的企业品牌理念:安全・智见。并宣布启动「看见美好生活」公益计划,从 “为爱守护” 到 “安全・智见”,彰显了 360 智慧生活此次在战略与品牌层面的双重焕新。安全脱胎于 360 智慧生活的基因与灵魂,智见则突出 “视觉 + AI” 的未来战略方向。未来,360 智慧生活将铭记与社会共享发展的责任,致力于守护全球每一个家庭,每一家企业,以视觉 + AI + 安全为核心,让更多人智见美好生活。

产业大模型智慧生活360视觉云
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

视觉问答技术

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

数据可视化技术

数据可视化被许多学科视为现代视觉传达的等价物。为了清晰有效地传递信息,数据可视化使用统计图形、图表、信息图和其他工具。数字数据可以使用点、线或条编码,以视觉传达定量消息。有效的可视化帮助用户对数据进行分析和推理。它使复杂的数据更容易理解和使用。用户可以根据特定的分析任务进行数据可视化,例如进行比较或理解因果关系,并且图形的设计原则(即,显示比较或显示因果关系)来进行可视化。表通常用于用户查找特定测量的地方,而各种类型的图表用于显示一个或多个变量的数据中的模式或关系。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

推荐文章
暂无评论
暂无评论~