Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

印象笔记公布自研轻量化大语言模型「大象GPT」,推出「印象AI」,3月内完成产品对接

近日,印象笔记向外界透露即将推出「印象AI」,用以回应行业和用户对印象笔记在AI领域布局的关切。「印象AI」是基于印象笔记多年自研的轻量化大语言模型「大象GPT」和国内外大语言模型相结合的混合模型方案。

从官方披露的信息来看,「印象AI」是印象笔记在持续研究世界领先的包括 OPT 、BLOOM 等类 GPT-3.5结构的大语言模型 (Large Language Model)基础上,结合其多年来对高质量数据的处理经验,进一步基于自行设计的Multi-task Instructs数据集,  Fine-Tune 形成了数十亿参数规模的自主可控的轻量化语言模型—— 大象GPT,同时还陆续与国内外领先的大语言模型提供商进一步结合,推出的生成式人工智能产品。上线初期,「印象AI」将为用户提供多种场景下的开放式写作助理,随着印象研究院进一步加强基于人类反馈的强化学习来实现模型的优化,「印象AI」有望提供更多更强的功能支持。

近期ChatGPT的大火,促使不少产品纷纷宣布接入不同的大语言模型,但由于有些模型并未开放API给第三方,以虚拟登录的方式提供此类模型的服务对于用户使用的稳定性、安全及合规性都存在一定风险。同时,业内相继推出的AI产品通常都是以产品内直接对接某种特定大语言模型的API为用户提供服务,大语言模型的“静态”特性,要求它必须在兼顾已具备的能力之外,定期更新以吸纳世界范围内的新知识,在此过程中所产生的高额成本,最终还需要用户来承担。

作为现阶段国内少数拥有自研轻量化语言模型的应用厂商之一,印象笔记即将推出的「印象AI」采取了以自研模型与国内外大语言模型相配合的方式,一方面确保模型自主可控,保证AI产出的内容合法、合规;另一方面,混合模型方案可以更快速地针对印象笔记用户的需要定制任务、引入特定数据,并进行有针对性的微调和模型迭代,从而有效降低用户的使用成本。

印象笔记在官方公告中表示,「印象AI」的功能不仅限于开放式写作助理,而是将深入到知识管理的各个环节,辅助实现完善信息记录、高效信息整理、智能多模态信息关联与创作内容的润色和升华,成为由GPT驱动的多模态、全能知识管理助理。

值得注意的是,印象笔记还极富创新性地提出了“构建私人生成式语言模型”的研发方向,未来,印象笔记将尝试在获得用户授权的前提下,将私人语料与大语言模型通过适配层对接,训练成为保存个体记忆、呈现个人创作风格的私人化生成式语言模型,让「印象AI」有机会发展成为每个用户的信息宝库和信息世界里的数字孪生

此次「大象GPT」的研发训练及「印象AI」的推出和落地均由印象笔记专注人工智能的研发机构印象研究院主导推进。此前,印象研究院已陆续为印象笔记App研发了一系列以人工智能为核心技术驱动的智能化产品功能 :智能推荐、智能标签、智能摘要、知识星图等,也一直在AIGC( 内容人工智能自动生成)领域持续深耕。据悉,「印象AI」将于3月份内开启报名体验。

产业大型语言模型GPT印象笔记
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

数字孪生技术

数字孪生(*Digital twin*)指可用于各种目的物理资产(物理孪生,physical twin)、过程、人员、场所、系统和设备的数字副本。

语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

印象笔记机构
推荐文章
暂无评论
暂无评论~