Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

来自一线大咖的前沿观察与洞见,大模型技术 Workshop 第一期活动举行

为了更好地分享大模型技术最新进展,张江科投、张江孵化器、机器之心、WAIC Circle 联合发起举办了“大模型技术 Workshop”系列活动,邀请产学研一线大咖带来前沿观察与洞见。

3月22日,大模型技术 Workshop 第一期成功举行。本次活动围绕“Claude 3热浪来袭,一起聊聊文本大模型的重点技术路径”展开,并得到了张江科学城商会的大力支持。

张江孵化器总经理金红梅

张江孵化器总经理金红梅介绍,作为张江集团向“卓越的创新策源和产业发展生态综合服务商”战略转型中聚焦创新策源的主要板块,张江科投坚持以产业促进为价值核心,探索升级科技创新服务能级,为创新驱动发展注入新动能。

复旦大学自然语言处理实验室副研究员桂韬

大模型时代AI大模型如何与人类意图对齐复旦大学自然语言处理实验室副研究员桂韬围绕大模型能力对齐展开了分享。AI对齐包括 RLHF/RLAIF 等成熟的基础方法,RLHF/RLAIF都采用强化学习的方法,使用反馈信号来优化模型。除了使用指令数据集进行微调外,还可以使用偏好数据集训练奖励模型。尽管AI价值对齐是一项难题,但推动产学研协作等,可进一步促进AI伦理与人类价值观相匹配。

在提问环节,桂韬也针对国内核心价值观对齐、多模态对齐是否会取代纯图片/视频模型,图片视频的Tokenlization设计后续会如何取舍等问题展开详细回答。

波形智能CTO周王春澍

波形智能CTO周王春澍分享了超长文本创意写作大模型的训练和推理方案。当前,理解和生成长文本对大模型并非难事,但让大模型像人类一样写出具有创意的长文本内容或小说,并不简单。今年1月,波形智能发布了一款能生成长文本的大模型:内容创作垂域SOTA大模型“Weaver”。波形智能通过写作领域专业预训练和一套创新性的数据生成和 Alignment算法,Weaver 在写作领域的各种任务上均取得了领先 GPT-4 和众多中文通用大模型的效果。此外,周王春澍对于现场嘉宾的提问,例如模型学习对象、优秀文本的获取、内容商业化等展开回答。

亚马逊云科技资深解决方案架构师林业

亚马逊云科技资深解决方案架构师林业围绕Amazon Bedrock最新支持的Claude 3模型新特性、核心能力测评进行了技术解析。今年三月,Anthropic重磅发布了Claude 3模型,Amazon Bedrock是业界首个支持Claude 3全托管并且正式可用的服务。Claude 3具有以下特征:提升回答准确率,降低幻觉;200K超长上下文准确召回等。最后,林业进行了小红书写作助手、PPT助手、代码助手等Demo场景演示。针对长文本技术、工程等问题,林业与同事也详细地进行解答。


至此,本期活动落下帷幕。“大模型技术 Workshop”系列活动将在后续持续举行,详细信息敬请关注张江科投。


产业
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
复旦大学机构

复旦大学(Fudan University),简称“复旦”,位于中国上海,由中华人民共和国教育部直属,中央直管副部级建制,国家双一流(A类)、985工程、211工程建设高校,入选珠峰计划、111计划、2011计划、卓越医生教育培养计划、卓越法律人才教育培养计划、国家建设高水平大学公派研究生项目,九校联盟(C9)、中国大学校长联谊会、东亚研究型大学协会、环太平洋大学协会的重要成员,是一所世界知名、国内顶尖的全国重点大学。

相关技术
准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
推荐文章
暂无评论
暂无评论~