Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

数智上海 2023 峰会 | 通用、垂直、AI Agent,大模型是如何拥抱千行百业应用场景的?

由于通用大模型的泛化特性,它很难在落地行业场景中精准满足用户需求。让通用大模型学习行业知识和行业语料成为行业大模型,再进一步学习业务知识和专业领域工具演进为场景大模型,是当前大模型落地应用的关键路径。未来,AI Agent 的产品形式被越来越多地认为是大模型的进化方向,是赋能各行各业的高效生产力工具。

通用大模型性能如何保障?如何架构行业垂直大模型?AI Agent 落地前景?数智上海 2023 峰会上,最具代表性的产学一线嘉宾围绕大模型演进过程,带来了前沿分享。

以「智能创新赋能产业数字化转型」为主题,数智上海 2023 峰会已圆满落幕。其中,聚焦引领新一轮科技浪潮的关键 AI 技术,峰会特别举办了「数智说」生成式人工智能创新应用赋能千行百业论坛。

复旦大学计算机科学技术学院教授、博士生导师,中国中文信息学会理事张奇,商汤科技副总裁张少霆,科大讯飞 AI 研究院副院长盛志超,创新奇智技术副总裁郭江亮等进行了主题演讲。圆桌环节,达观数据首席战略官刘江贤主持,张奇、中科曙光智能计算产品部总经理杜夏威、实在智能创始人、CEO 孙林君,澜码科技创始人、CEO 周健、上海人工智能产业基金投研合伙人刘经国交流了观点。

嘉宾们分享了生成式 AI 最新技术进展,以及其在医疗、教育、工业等重要领域落地的关键经验,探讨了 AI Agent 的落地前景。

复旦 NLP 实验室核心成员张奇

摒弃神化与拟人化大模型

ChatGPT 能够高效生成更符合人类价值观的内容,背后的关键技术正是基于人类反馈的强化学习(RLHF)。然而受限于实验设计困难、试错成本巨大等多重因素,RLHF 的稳定训练仍然是一个难题。

复旦 NLP 团队今年发布多项 RLHF 相关工作成果。复旦大学计算机科学技术学院教授、博士生导师,中国中文信息学会理事张奇结合最新研究成果带来「AI 赋能百业,大模型助力行业数智化升级」主题分享。


此次,张奇教授总结了 RLHF 大模型训练各阶段关键问题。预训练阶段,基础大语言模型训练中的「工程秘密」大部分已经公开,但仍需做好「预训练数据构成和数量、预训练数据对模型各类任务效果影响、语言与知识的关系」等基础问题研究,否则大模型训练仍是「炼丹」。指令微调阶段,千亿模型的 SFT 模型训练数据需求不到百万量级,难点在于构建高质量训练语料。

OpenAI 此前公布的 InstructGPT 技术报告中将近端策略优化(PPO)算法作为 RLHF 阶段的强化学习算法,但未开源训练技术细节。FudanNLP 团队持续投入 RLHF 完整工作流程及 PPO 算法研究,确定了使得 PPO 算法在大模型人类对齐方面行之有效的关键因素,并进一步总结出在大模型上训练更稳定的 PPO-max 算法。张奇教授展示了 PPO-max 算法效果并表示近期会发布安全伦理相关报告。


「摒弃神化与拟人化大模型,它们只是统计学习的精彩舞者。」张奇教授认为目前大模型表现还是可以在统计机器学习范畴下进行解释,仍是「匹配」而非「理解」。此外,现阶段通用大语言模型直接落地产业存在一定困难,未来落地方向需要结合场景,「do something people want」,不只是写诗、做论文,还应助力行业提升生产力。

商汤科技副总裁张少霆

打造「商汤医疗大模型工厂」

随着大模型开始进入产业导入期,大模型的垂直领域应用成为主线。从医学科研、药物研发、智慧诊疗到医院管理等,产学研正联手推动高质量医疗领域基础模型构建及产品落地。AI 成为每个医生的诊疗助手、每个人的健康助手的医疗场景新范式正在显现。

商汤科技副总裁张少霆带来了「基于 AI 大模型打造未来医疗场景新范式」主题演讲。


人的疾病有几万种,存在大量长尾问题,大模型、基础模型的能力会有助于快速开发医疗长尾问题解决方案。基于此,商汤在医疗领域进行了丰富的大模型落地应用探索。


商汤与行业伙伴合作,推出了医疗大语言模型、医疗影像大模型、生信大模型等多模态基础模型群,覆盖CT、MRI、超声、内镜、病理、医学文本、生信数据等广泛医疗数据模态。借助商汤大装置的超大算力和医疗基础模型群的坚实基础,商汤能够化身「医疗大模型工厂」,帮助医疗机构针对下游临床任务高效训练模型。该模式突破了医疗长尾问题数据样本少、标注难度高的瓶颈,实现了针对不同任务的小样本、弱标注、高效率的训练,满足不同医疗机构个性化、多样化的临床诊疗需求。


在医疗多模态基础模型群赋能下,商汤自主研发的SenseCare®智慧诊疗平台搭载 20 余个 AI 辅助诊疗模块,可提供覆盖全身多部位、多病种、多模态数据的 AI 辅助分析,赋能诊-疗-愈全流程。其中,SenseCare®肝脏智能手术规划系统可以快速完成肝内及腹部多器官的精准三维重建,并支持多种切除术式智能规划,将原先 1~2 小时的手术规划时间缩短至 3~5 分钟,大幅提升了术前规划效率。该产品已落地瑞金、新华等医院,为很多高难度手术提供了保障。

针对医疗大语言模型的应用场景探索,商汤研发了医疗健康大语言模型「大医」,内嵌智能自诊、诊后随访管理、智慧病历、影像报告结构化等 13 个预设场景,可高效辅助医生诊疗与患者服务。「大医」支持提示工程自定义、长程记忆存取和医学知识库查询总结等个性化功能,可帮助医疗健康产业链上下游机构打造专属医疗健康大模型,推动行业全方位数智化转型。目前「大医」已落地郑州大学第一附属医院、瑞金医院、新华医院等医院,赋能用药咨询、患者服务、辅助决策等多元场景。

科大讯飞 AI 研究院副院长盛志超

共迎「认知大模型+教育」大时代

认知大模型的「智能涌现」将带来解决人类刚需的全新机遇。改变信息分发获取模式、革新内容生产模式、全自然交互完成任务、实现专家级的虚拟助手、颠覆传统手工编程方式、成为科研工作的加速器,这些大模型能力催生的变革正带来多种教育场景的颠覆式创新。

科大讯飞 AI 研究院副院长盛志超分享了星火认知大模型赋能教育的实践探索。


ChatGPT 发布后,科大讯飞正式启动「1+N」认知大模型专项攻关,其中「1」是通用认知智能大模型,「N」是大模型在教育、办公、汽车、人机交互等各个领域落地,目前一系列产品已经实际应用。

基于星火认知大模型能力开发的多种应用,已经支撑了不同场景教学工作:

• 教学助手,星火教师助手应用能够辅助教案设计、习题情境改造、作文批改等;

• 学习助手,「讯飞语伴」面向各学段学生提供个性化口语陪伴老师,另外基于科普中国优质内容资源构建科普大模型;

• 编程助手,面向信息科技教学场景,辅助教师高效编程教学,辅导学生自主编程与学习(Python);

• 心理辅导助手,构建心理健康专有模型,具备多模态情感识别能力、共情表达能力、寻因式提问能力、个性化心理指导能力四大核心能力。


从实现效能提升、加速模式创新到支撑育人变革,大模型带来了教育领域机遇,同时在专业性、教学秩序、协同素养提升等方面带来挑战。盛志超院长认为,应该以乐观的态度看待大模型与教育结合带来多种场景的颠覆式创新。

创新奇智技术副总裁郭江亮

为工业大模型落地提供全链路 AI 能力

大模型的出现给智能制造带来广阔想象空间,但是工业领域涉及全生产流程、供应链各个环节以及 ERP、MES、PLC 等,提供端到端解决方案并非易事。

创新奇智技术副总裁郭江亮进行了「大模型助力新型工业化:重构工业生产力与生产关系」主题演讲,分享了企业在工业大模型落地方面的前沿工作。


全面拥抱大模型技术是企业提升竞争力必由之路,而对于工业领域的企业来说,垂直大模型不需要唯参数论,大模型落地性价比是关键因素。通过更好地使用大模型技术,以更低成本、更好产品,满足工业领域里面中长尾、细小场景需求是当务之急。

创新奇智推出的以 AInno-15B 为核心的「奇智孔明 AInnoGC 工业大模型」,建立在开源通用大模型基础上,专注工业知识的生成、问答以及工业自动化任务的编排。从效果看,150 亿模型参数是最优效果,同时部署时对算力要求较低。


创新奇智构建起由「MMOC 人工智能技术平台」和「AInnoGC 工业大模型技术平台」组成的技术双塔布局。其中,MMOC 平台提供传统 AI 能力,端到端支持 AI 解决方案创新、研发和交付,工业大模型支持文本、视觉、多模态内容生成,驱动 AI 2.0 应用和解决方案的开发与落地。


郭江亮表示,创新奇智将AI技术双塔平台化,组合研发打造解决方案,未来还将持续聚焦工业细分领域,助力打造更多专精特新企业。

产学投共论大模型下一站

AI Agent 会是大模型未来发展方向吗?


受大语言模型浪潮推动,AI Agent 相关研究快速发展。两者的区别在于,大模型与人类之间的交互是基于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果;而仅需给定 AI Agent 一个目标,它就能够针对目标独立思考并做出行动。因此,AI Agent 的产品形式被认为将广泛应用于各行业组织数字化实体打造进程。

AI Agent 会是大模型的未来发展方向吗?以此为题,学术、产业、投资界多位嘉宾进行了深入交流。

达观数据首席战略官刘江贤主持了本次对话,指出 Agent 不是一个科研的具象,而是一个落地应用场景的具象,大模型发展不仅要从供给侧发力,更要听需求侧真实声音,「Agent 像是产、学、研之间交汇的基点」。

「我们坚定地看好 Agent,并且认为 Agent 会大爆发。2024 年会是 Agent 元年。」实在智能创始人、CEO 孙林君认为,首先,当前处在从人工过渡到人机协同、再到机器完全自主完成的过程中,要对 Agent 有合理的预期,不能把 Agent 和 AGI 画等号,认为它无所不能,这是不符合实际的预期;其次,有针对性的进行人机协同的产品设计才是现实思路,设计出来的产品才是高可用的,Agent 的实用性才会更强。

「Agent 未来落地,真正有话语权是那些业务场景的用户。」中科曙光智能计算产品部总经理杜夏威认为,要从业务侧出发看 Agent 的落地形式和方向,围绕着业务需要的 Agent,判断对模型规模、算力形式的需求。

当前大多数 RPA 厂商,都在以生成式 AI 补充 RPA 为中心的自动化流程,或者基于 AI Agent 重新构建超自动化产品。张奇教授认为这将是大模型 B 端落地的关键方式,传统 RPA 构建业务流程自动化存在脆弱性,大语言模型的引入这意味着这些机器人不会停在新数据导致的「死胡同」,而是可以从错误中「学习」并调整其一系列任务。

信息化是数字化的前提,数字化是数智化的前提。澜码科技创始人、CEO 周健认为,AI Agent 落地过程首先要将专家知识通过各类信息系统实现数字化;其次是基于对话式UI,建立机器适应人的新的人机交互模式;第三步则是通过这种新的交互模式,反复使用和打磨专家知识,最终实现领域知识的循环沉淀。

Agent 产品将会越来越多,未来将有望成为 AI 应用层的基本架构,包括 to C、to B 产品等。上海人工智能产业基金投研合伙人刘经国认为,从投资角度看,国内 to B、垂类应用仍是 AI Agent 容易率先落地的方向。

产业
暂无评论
暂无评论~