Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?

2023 年上半年,百模大战如火如荼,成了国内 AI 领域最热门的讨论话题。但相比之下,腾讯显得有些低调。在战况最激烈的 4、5 月份,腾讯没有向外界发布任何信息。在 5 月份的 2023 腾讯股东大会上,甚至有人忍不住问马化腾,腾讯是不是在憋什么大招?

某种意义上来说,腾讯确实在憋「大招」。但这个「大招」和过去几个月各大公司密集发布的大模型有所不同。在和大模型相关的所有消息中,腾讯都在强调「产业」,而不是 C 端的「chat」场景。就连最受关注的通用「混元大模型」都是在以产业互联网为背景的「腾讯全球数字生态大会」上亮相的,与之相关的 Maas 行业大模型解决方案更是多次被重点阐述。可以说,腾讯的大模型服务从一开始走的就是一条产业化的路径。

为什么要走这条路?腾讯集团高级执行副总裁、云与智慧产业事业群(CSIG)CEO 汤道生道出了他在这波大模型浪潮中观察到的一个普遍现象,「面对 AI 的发展,很多企业家和从业者,一方面觉得很兴奋,迫不及待地想要拥抱大模型技术;但另一方面也很焦虑,不知道从何做起。」于是,回应这种焦虑成了腾讯云在这波「百模大战」中的首要任务,这和腾讯云 5 年来一直践行的「产业互联网战略」一脉相承。

正如汤道生所说,伴随着大语言模型的发展,产业和社会正在从云化、数字化,走向智能化,这是一步一个脚印的过程。其间,腾讯云扮演了关键的基础设施角色。通过帮助企业上云,腾讯云为企业带来了更高的灵活性、可扩展性和更低的运营成本。在云化已经取得阶段性成果的基础上,企业对于智能化的需求日益迫切,作为重要基础设施并积累了丰富经验的腾讯云自然也迎来了新的历史使命。在这样一个节点上,腾讯云将如何借助大模型等工具,帮助企业打好「智能化」这场战役成了一个备受关注的问题。

在刚刚召开的以「智变加速,产业焕新」为主题的 2023 腾讯全球数字生态大会上,汤道生分享了腾讯云对于这一问题的思考。
                                        做大模型,腾讯云「直奔主题」,主打「务实」

「我和孩子都是历史人文爱好者,端午想去苏州,请推荐预算 5000 以内的行程规划,需要每天去 2 个不同的景点玩。」这是 6 月 19 日,腾讯云在「行业大模型及智能应用技术峰会」上向自家文旅行业大模型抛出的一个考题。

令人眼前一亮的是,这个大模型不仅像其他通用大模型一样列出了可以去的景点,还给出了每天的交通、景点、住宿安排以及对应的价格和链接,远远超出在场观众期待。在这个演示的视频号评论区,有客户次日就找上了门,问「有需求怎么联系你们?」或许,这就是「务实」的力量。
「大家都喜欢从 to C 的角度,去关注和使用通用大模型,关注点可能会有些走偏。我们更愿意直奔主题,以比较务实的态度去解决问题。」在做大模型的路径上,汤道生表明了这样的态度。

所谓的「直奔主题」,可以理解为更加关注产业应用以及里面的具体问题,而不是那些「天马行空的看上去很『嗨』的场景」。在汤道生看来,前者「朴实而有用」。而要解决这些问题,仅依靠某个通用大模型在现阶段肯定是不够的。因此在大模型的选择上,腾讯云并不「迷信」任何一个通用大模型,而是打造了一个「大模型商店」。这个商店既上架了腾讯的通用混元大模型,还上线了 20 多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等 20 多个领域的行业大模型。 
重要的是,企业在选到合适的模型后,还可以利用自己的专有数据做进一步的训练与精调,快速生成更有针对性的专属大模型。

不过,这个环节有很多现实的问题,比如企业可能会担心腾讯云的数据处理能力是否强大、可靠、安全。面对这些挑战,腾讯云也显示出了务实的一面。

首先来看数据质量。众所周知,在深度学习领域,扩大模型规模和提高数据质量都是提高性能的有效方法。前段时间,微软的研究者发现,如果数据足够优质(达到教科书质量),13 亿参数的小模型可以媲美比它参数规模大几个数量级的模型。上海交通大学清源研究院和里海大学的一项研究也发现,如果从 3000 多条数据里选出 200 条高质量数据用来训练模型,在同样的配置下,后者性能会更好。所以,对于注重降本增效的产业界来说,提高数据质量是一个非常值得探索的方向。这恰恰也是腾讯云一直以来努力的方向,他们的 TI 平台内置了完备的数据清洗、标注、回流等套件,能够满足企业对于高质量数据和高速度「数据飞轮」的需求,让企业形成自己的竞争壁垒。

其次来看数据安全。在 ChatGPT 诞生之后的很长一段时间,很多大公司都禁止自己的员工使用这项工具,以防数据泄露。「用户数据一旦被泄漏,对企业经营可能造成重大的损失,对企业信誉带来长期负面的影响,」汤道生强调说。因此,腾讯云一直把数据安全作为一个重点问题来解决,多年来被权威市场分析机构评为这一领域的「领导者」和行业第一。也正因如此,腾讯云备受数据敏感型企业的青睐。据悉,腾讯安全已经服务了 80% 以上的金融行业客户、90% 以上的头部能源企业、80% 以上的头部车企。这也是「务实」的力量。 
                                          身处「百模大战」,腾讯云准备跑「马拉松」

前面提到,5 月份的时候,有人问过马化腾,为什么大家都在抢发大模型,腾讯却异常冷静?当时马化腾是这么回答的:「这是几百年不遇的、类似发明电的工业革命一样的机遇。对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。」

在采访中,汤道生也表达了类似的观点,指出大模型在产业互联网的落地是一场马拉松,这场马拉松可能以十年为单位,「现在可能才跑到一公里」。而在这样的初期阶段,腾讯云更希望做到的是稳扎稳打,而不是急于求成。

因此,在过去的几个月里,腾讯一直在内部持续打磨混元等大模型,包括借助「求真」算法降低模型幻觉,通过强化学习提升抗诱导能力等。不过,更重要的是,他们把自己重要的、丰富的业务场景当成了「磨刀石」,让混元大模型接入了 50 多个腾讯产品进行测试,包括有 4 亿用户的腾讯会议、覆盖 6 亿用户的腾讯广告等。在技术圈,这叫「吃自己的狗粮」,即自己的产品自己要用,把产品在内部打磨好再拿给产业客户。

为了让大家理解这个过程,汤道生举了一个「腾讯乐享」的例子。「腾讯乐享」是腾讯内部的一个知识库社区,沉淀了 150 万篇腾讯员工创作的各类技术、经营文档。之前,员工要想在这么大的体量的知识库里找到想要的信息非常不易。但是在接入基于行业大模型打造的 AI 助手后,他们用自然语言的形式去向模型提问就能得到想要的信息。此外,这个产品还考察了腾讯云的数据存储、查询能力,技术人员通过向量数据库,实现了非结构化数据的有序存储和快速检索,很好地解决了这个问题。等这些技术都通过内部考验后,腾讯云才会考虑将其推给客户。
除了对于模型的打磨,腾讯云决定打持久战的另一个表现是对 AI 服务流程所需的全链路工具的重视。他们的 TI 平台覆盖了从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署到 AI 应用开发的「产业 + AI」落地全流程链路。这是一个找到痛点,各个击破的过程。整个平台构建起来需要数年的时间,后续的打磨更是需要花费很多精力。但腾讯云一直在有条不紊地迭代,一个问题一个问题去解决。

在喧嚣的「百模大战中」,这种自上而下稳扎稳打的风格和打持久战的决心折射出了一种难得的清醒,也让人感觉更加踏实。

                                         面对挑战,腾讯云保持「开放」

回到开头的产业「智能化」命题。随着 AI 技术的不断发展进化,我们其实是离这个命题越来越近的。但又因为这个命题太大,任何一家公司在为之努力时都会发现自身的局限,腾讯云也不例外。在汤道生看来,要克服这些局限,最重要的原则就是要保持「开放」。

这种「开放」性在腾讯云对待大模型的态度上体现得非常明显。他们的模型商店不仅上线了自己的大模型,还上线了很多开源大模型。因为在汤道生看来,在解决具体问题时,只要是技术能力和场景相贴合就可以了。「如果客户希望用他想要的模型,接入腾讯会议,实现智能化功能,我们也是开放欢迎的,」汤道生举例说。

这种对待大模型的开放态度折射出的是腾讯云现在做产业互联网所秉持的风格。在过去几年里,腾讯云经历了一段转型,从最初承载大集成类项目为主转向了更为开放、聚焦的「被集成者」角色。在这个过程中,他们发现,自己的强项其实在于长期以来积累的技术和产品能力。利用这些能力把底座做好,然后以被集成的方式去跟更多的合作伙伴合作对于腾讯云来说是更加可持续的。

「客户所处的行业是很专业的,腾讯也未必这么熟悉客户所处的这些行业,也没必要装我们懂,」汤道生坦言。因此,在打磨好自己的技术、产品的基础上,很多时候,腾讯云更依赖合作伙伴去服务客户。

「比如金融行业有挺多很专业的应用,我们并不是那么懂,但是他们可能同时有数据库的需求。我们可以很负责任地给他们提供一个高性能、高可靠的数据库产品,这也是腾讯云在自身业务中多年锻炼出的一些平台产品和技术能力。有些客户可能也有一些服务商为他们提供 DBA(数据库管理员,Database Administrator)服务,我们没必要再去干 DBA 的工作,反过来我们很愿意跟这些服务商进行合作,帮助他们熟悉我们的产品,提供支持、培训,让他们能够成为服务客户的一线伙伴。」汤道生举例说。

这条开放的「被集成」路线在腾讯云内部贯彻得非常彻底,而且汤道生说自己「从来没有犹豫过要不要走回头路」。

当然,与人合作的前提必须是自己的技术、产品够硬。所以我们才看到腾讯在大模型相关的每一次发布中都相当谨慎,因为汤道生要确保负责每个产品模块的团队都能在行业里做到数一数二

这种开放的做事方式创造了一种双赢的局面:不仅让腾讯云的业务毛利实现了增长,也让合作伙伴利润大增。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的 4 倍。对于「智能化」这一复杂的长期愿景来讲,这是一个非常正向的循环。
「未来,随着很多企业逐步迈向智能化,AI 的应用从老百姓的吃喝玩乐、衣食住行,到企业工厂的生产、销售、服务、办公都会覆盖,场景足够宽广。不会有一家公司能够包揽全部工作,因此 AI 生态也特别需要合作开放。」汤道生说。

未来,他希望以持续稳定的合作规则,让伙伴与腾讯的合作分工更清晰、投入更有积累、收益更可预期,与伙伴一起共建产业智能未来。
产业
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

分析机技术

分析机是由英国数学家查尔斯·巴贝奇设计的一种机械式通用计算机。从1837年首次提出这种机器的设计,一直到他去世的1871年,由于种种原因,这种机器并没有被真正的制造出来。但它本身的设计逻辑却十分先进,是大约100年后电子通用计算机的先驱。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
推荐文章
暂无评论
暂无评论~