Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

国内销量持续领跑,荣耀告诉你切入AI手机的正确姿势

该有人给出个标准了。

「AI 手机」到底是什么?这个问题至今还没有结论。

ChatGPT 出现后,科技界迎来技术爆发。自去年底开始,新一代的旗舰手机纷纷引入大模型,它们有的实现了大模型端侧落地,有的推进端云一体,配置了多种 AI 能力,有的引入了第三方 AI 应用。虽然都叫 AI 手机,但发力点各不相同。

有人说,如果一台手机的 AI 算力大幅提升,能够感知真实世界,并用大模型进行理解和创作,那它就是 AI 手机。

这种定义下的设备,就是手机的下一个形态吗?

最近,全世界似乎都在等苹果 6 月 WWDC 大会来给 AI 手机进行「定调」。

据说在这次大会上,苹果将随 iOS 18 的大版本更新推出一系列全新生成式 AI 能力,覆盖智能搜索、AI 助理、运动健康以及生产力应用。

但在苹果 AI 解决方案全面揭秘之前,我们在国内手机厂商中似乎已经看到了 AI 手机未来该有的样子。

手机上有大模型,就是 AI 手机吗?

最近手机厂商推出的旗舰智能手机,通过引入或者内置 AI 大模型,已经为用户带来了一系列的 AI 智慧新体验。比如,我们已经能够在智能手机上体验到新一代 AI 助理、图像生成、文档摘要、语音翻译、AI 影像处理等等。

但很多时候,这些功能实际上不用手机接入大模型或内置大模型,第三方 APP 联网的云端 AI 也能完成,甚至比手机厂商做的还要智能。

所以,直击灵魂的问题来了:把大模型接入端侧的意义是什么?接入或者内置大模型,并打造一系列的 AI 应用就是 AI 手机未来的样子吗?

关于这个问题,苹果在最近披露的一篇技术论文中,给出了一种可能的答案。

在《ReALM: Reference Resolution As Language Model》这篇论文中,苹果提到了一个可以在端侧运行的大模型 ReALM,其在运作过程中,可以清晰识别屏幕中的各种元素,包括按钮、图标、文本框等等。识别之后,它会对这些元素进行文本转换,记录每个元素的确切位置和它们的关系,并将屏幕上的元素和位置信息,转换成详细的文本描述,输入语言模型,让其学会解析用户的指令。

图片

不难想象,在无数次观察屏幕上的各种用户操作后,大模型将会越来越精确的分析并总结出用户使用手机时的既定行为模式,并可以借助一些 Agent 技术,为用户提供自动化、个性化的操作。

比如,每天下班,你都会连接投影仪,投屏自己喜欢的电视剧,ReALM 在学习行为习惯后或许能自动帮你连接设备,并投屏好昨天未看完的电视剧,你只需要点击播放即可。

事实上,这种充满想象,甚至一度让人联想到电影中「贾维斯」的 AI 手机方向,已经有国产手机厂商早于苹果落地,并仍在不断进化中 —— 今年年初,荣耀发布了 AI 使能的全场景操作系统 MagicOS 8.0,依靠平台级 AI 以及自研端侧 AI 大模型带来了行业首个基于意图识别人机交互,改变了人去适应机器的传统交互模式,让手机能够学习人,了解人,并能主动为人提供服务。

而这种区别于行业普遍做法的 AI 手机路径,也得到了当前市场的验证。

4 月 25 日,国际数据公司(IDC)发布的最新手机季度跟踪报告显示,荣耀以 17.1% 的市场份额拿下第一。据 IDC 中国区副总裁王吉平介绍,此次荣耀登顶,AI 成为关键增长引擎。

其中,荣耀全新旗舰 Magic6 系列得益于 AI 功能的增加,以及影像,屏幕等全方位的升级,首销第一季度出货量超过上一代产品前二季度出货量之和;在搭载平台级 AI 的荣耀 Magic V2 以及其他折叠屏家族产品的推动下,去年以来,荣耀折叠屏手机份额同比涨幅最高达到 675.4%。

AI 手机的未来 ——AI 智能体

在荣耀看来,当前行业以大模型赋能应用或者打造 AI 应用的路径更像是手机 AI,而不是 AI 手机。

荣耀 CEO 赵明在近期谈话中更是直言:「手机 AI 不等于 AI 手机。AI 手机意味着用 AI 来重构和使能手机应用和操作系统,以及消费者体验和业务逻辑的方方面面,AI 是根基,AI 在手机上是无处不在的,这才能叫 AI 手机。」

图片

今年 3 月,荣耀提出 AI 使能的全场景战略,进一步明确了在 AI 领域的战略方向,定义了智能终端的 AI 四层架构

图片

                              荣耀 AI 四层架构。

其中:

  • 第一层是用 AI 使能跨系统、跨设备的融合,让不同的操作系统用 AI 来做决策实现手机、平板、PC 等设备之间的无缝连接和数据共享;

  • 第二层是用 AI 来重构单终端的操作系统,让终端越用越懂你、越用越好用,比如在 MagicOS 8.0 上,基于平台级 AI 能力带来了基于意图识别人机交互体验;

  • 第三层是 AI 在端侧的应用,比如抠图、拍照渲染、总结文档等应用级 AI;

  • 第四层是 AI 的端云协同,是在保障用户隐私安全的前提下,实现 AIGC 和网络大模型等网络侧 AI 在手机上的呈现。比如荣耀此前与百度云达成战略合作,以千帆大模型助力 YOYO 助手打造更专业的用户服务,带来了文本创作、知识问答等智慧功能。

据赵明介绍当下手机厂商 AI 的发力点集中于这三四层面,而四层 AI 全部发力的只有荣耀,并且荣耀的重点在一二层。

AI 在端侧的应用是一条探索之路,没有前人的经验可供参考。

在不同的路径中,一些厂商选择以点带面的方式切入,通过在手机中加入很多独立的生成式 AI 能力,解决了多类场景中的问题,如智能翻译、修图、高级搜索、内容生成等等。

这种方法快速引入了新技术,能够高效地解决问题,提升部分操作的效率,但适用的场景具有局限性,仍处于「我们告诉手机要怎么做」的阶段。

此时,大模型智能体(Agent)走入了人们的视线。

知名 AI 学者吴恩达(Andrew Ng)最近表示,很多人都已经历过「ChatGPT 时刻」,即尝试 AI 的时候发现体验大大超出预期。也许你很快还会经历类似的「AI 智能体时刻」。

图片

                               图片来源:https://twitter.com/AndrewYNg/status/1779606380665803144

吴恩达认为,AI 智能体工作流今年将有巨大进展,其智能程度可能会超过下一代基础模型。

荣耀正在做的,就是在手机中利用智能体驱动大模型能力,这就与「手机 AI」的友商形成了对比。

如果我们对手机发出的指令,接收方是智能体驱动的 AI,它能像人类助理一样围绕场景理解意图并分解、编排任务,端到端地完成较为复杂的工作,如安排你的出行、规划旅行、组织聚会等。

更重要的是,智能体并不针对某类问题或者单个场景,而是利用了操作系统级的资源,能够感知场景变化,学习用户习惯,主动思考,决策调用系统所有能力。这样以来,大模型就能承接复杂任务,交互的体验也获得了升级。

图片

                                图片来源:《The Rise and Potential of Large Language Model Based Agents: A Survey》

以智能体为工具,利用 AI 重构操作系统,从内而外地重新构建手机的人机交互体验,相比单独引入能力,可以获得无限的可能性。这是荣耀一直在做的事,并且已经深耕了 8 年之久。

2016 年,荣耀第一次在智能手机端引入 AI 概念。智能手机在 AI 技术加持下,能实现相应的需求感知和机器决策,这是荣耀 AI 能力的 1.0 阶段。

2022 年,荣耀推出的平台级 AI 使能的全场景操作系统 MagicOS 7.0,能基于地理围栏和用户习惯等信息,主动提供场景建议引导及服务;2024 年 1 月 10 日发布的 MagicOS 8.0 包含的「任意门」功能,立足于用户意图识别,带来跨应用和跨设备的智慧流转。

在传统的手机系统中,OS 内核主要负责管理硬件资源,而平台级 AI 这一「新内核」则负责「管理」与人相关的因子,如个人知识库、位置与状态、习惯与画像等,帮助 OS 精准识别用户意图,高效调度系统服务,能够带来「猜你所想,懂你所需」的智慧体验。

此外通过以 AI 重构操作系统,荣耀还创新地推出了基于意图识别的「新生态」范式,以 YOYO 智能助理为载体,充分协同端云大模型的能力,带来了更多「意图直达」体验:端侧平台级 AI 大模型作为中控,理解用户意图,拆解编排任务,高效安全地连接云侧大模型,分发、融合、调度原子化服务,完成复杂任务闭环。在这个过程中,端侧大模型通过端侧防护网滤掉个人隐私,并确保个人信息不上云,保护了隐私安全。

更进一步,在应用层面上,荣耀的 MagicOS 不仅连接自身能力,也覆盖大量第三方服务。荣耀希望在 MagicOS 上把云侧通用大模型,以及面向各行业垂直领域的大模型融入成为一体,为每个用户提供更好的服务分发和任务闭环体验。

未来,荣耀希望能够打造一款可以持续的成长和进化的手机,当你用它越多它就越能懂你,越能够帮助你。

结语

在 AI 时代,当有人重构端侧,真的让手机懂你,AI 就会从几年前的应用和服务变成主导操作系统的基础,让手机变成用户的一个分身。当我们从这个逻辑去发展手机和 AI 的时候,AI 手机才会从一个概念落地成为实体。

在 AI 大模型能力持续提升,端侧算力和优化推动技术不断落地的今天,更为贴合用户使用需求的架构,不仅能让手机获得差异化竞争优势,而且还会逐渐形成新的生态链,引领生成式 AI 颠覆性创新。

这或许才是 AI 手机不断发展的方向。

荣耀 AI 手机走出的路,带来了更多想象力,未来正在显现更多的可能性。

产业AI 手机荣耀
相关数据
吴恩达人物

斯坦福大学教授,人工智能著名学者,机器学习教育者。2011年,吴恩达在谷歌创建了谷歌大脑项目,以通过分布式集群计算机开发超大规模的人工神经网络。2014年5月16日,吴恩达加入百度,负责“百度大脑”计划,并担任百度公司首席科学家。2017年3月20日,吴恩达宣布从百度辞职。2017年12月,吴恩达宣布成立人工智能公司Landing.ai,并担任公司的首席执行官。2018年1月,吴恩达成立了投资机构AI Fund。

所属机构
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

图像生成技术

图像生成(合成)是从现有数据集生成新图像的任务。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

意图识别技术

意图识别指理解说话人的意图 。

推荐文章
暂无评论
暂无评论~