Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

解决大模型复现难、协作难, 这支95后学生团队打造了一个国产AI开源社区

过去十年间,AI 技术经历了巨大的飞跃,无论是在自然语言处理、图像识别,还是在更多的创新领域,AI 的影响已无所不在。

伴随着研究数量的爆炸性增长,学术界和工业界同样面临着一些挑战,其中就包括「论文复现」和「跨学科协作」的难题。特别是当我们来到了大模型时代,面对动辄百亿参数量的模型研究,开源、复现、协作变得更加重要,但难度却更上一层楼。

论文复现,首先是评判一项成果价值的重要参考因素。同时,在快速发展的 AI 领域,确保研究的可复现性将更好地推动知识的积累和技术的普及,也是维护学术诚信和促进持续创新的关键所在。面对这些问题,倡导开放科学和透明研究显得尤为重要。通过开源代码、数据和实验细节、提供更低成本的、针对复现需求的算力平台,以及提供支持快速复现的交互式程序,我们或许能够在推进科学研究的道路上,建立更加稳健和可靠的基础。

如果说「复现难」的问题,就像是为研究者之间的「对话」增添了一道高墙。那么「协作难」的问题,同时也为跨学科的合作建立了无形的屏障。

大模型时代,如何搭建一个方便的、能够降低交流和协作门槛的平台已经成为一大挑战。我们所熟悉传统的软件开发协作方式,例如基于 Git 的代码管理与版本控制,在 A I 研发这种更依赖于实验而非确定性过程的场景下可能不再适用,其复杂的实验版本管理和较高的使用、部署门槛往往阻碍了不同领域专家之间的交流与协作。当前的 AI 领域需要新的协作模式和工具,包括更直观、易于使用的版本控制和协作平台,让非技术背景的专家也能方便地参与到模型的开发、评估和演示过程中来。

换句话说,无论是科研工作者还是从业者,都希望能在知识和技术的共享基础上,实现更加高效、有深度的协作,推动 AI 领域的进一步发展。

在这样的背景下,一个全新的 AI 开源社区平台「SwanHub」诞生了。

图片

体验地址:https://swanhub.co/

值得关注的是,SwanHub 来自西安电子科技大学的一支非常年轻的在校研究生和本科生团队。团队的四位成员均为 95 后,不仅有着丰富的 AI 研究经验,还有对开源的热情。在指导老师吴家骥教授和谭茗洲教授的带领下,他们从零开始构建了一个 AI 模型一站式协同开发、开源共享、可视化展示平台,旨在解决当前 AI 模型复现难、部署难、管理难的核心问题。

SwanHub 解决了哪些问题?

在 SwanHub 这一平台中,AI 研究者和从业者不仅可以获得丰富的开源模型和工具资源,还能够享受到协同开发的便捷与高效。目前,SwanHub 已经上线几大核心功能,包括 AI 模型托管、可视化展示等。

首先,AI 研究者可以将自己的代码托管到 SwanHub 上进行版本管理,像使用 Github 托管平台一样。但与 GitHub 相比,SwanHub 支持更高容量的大文件托管,研究者可将多达几十个 GB 的模型权重文件进行托管与版本管理。

图片

图片

「可视化展示」也是 SwanHub 的一大亮点。很多在顶级会议和期刊上发表的研究文章都会展示漂亮的效果和创新的技术。但在实际操作中,尝试复现这些研究成果的工程师和研究人员却常常遇到困难。正因此,近年来很多学术会议不仅要求作者提交代码,也要求提交一定数量的 Demo,提供更充足的研究信息,而 SwanHub 恰好提供了这样一个公开展示成果、获取更多科研流量的平台。

如下图所示,SwanHub 平台提供了一套简易的模型 Demo 部署工作流,让用户可以通过点击几个按钮的方式,轻松地将代码和模型权重部署成一个可视化、可交互的网页 Demo,实现实时在线测试 AI 模型的推理结果,并支持分享给协作者、审稿人、同行或公开在互联网上。SwanHub 也支持主流的可视化框架如 Gradio、StreamLit 等。

图片

图片

SwanHub 不仅为想要分享成果的研究者提供了一个展示自己开源模型的平台,其他研究者也可以在这里轻松地访问到其他研究者的开源成果、体验 Demo,以及在讨论区进行学术讨论。

此外,团队表示,SwanHub 即将上线两项功能:第一项功能是代码一站式部署服务,让用户可以轻松地将机器学习模型部署为一个云服务 API(应用程序编程接口),并同样支持开放给全社区或私有使用。对于开放自己模型的 API 的研究者而言,可以让自己的研究成果更快地接入到各个应用场景中,提高研究的影响力;同时对于使用者而言,也能更快地让自己的应用接入各类强大的开源 AI 能力。第二项功能是模型实验管理工具 SwanLab,用户可以将自己的实验日志记录程序接入 SwanLab,即可实现在线实验日志记录和管理功能。平台不仅仅能够帮助记录训练日志和托管中间模型,还能够提供可视化训练结果、训练完成消息推送、超参数记录与推荐、模型跨版本对比等功能,便于研究人员快速试错和开发,以及提升多人协同训练的效率。

图片

                                 正在开发中的模型训练日志托管功能

四个年轻人的技术理想

很少有人知道的是,SwanHub 开源社区平台的背后是四位年轻的「95 后」成员。

林泽毅、陈少宏、韩翔宇、雷清扬四人相识于西安电子科技大学的校园,曾出于各自对技术的兴趣组建过一个名为「光年科技工作室」的社团。后来,几个志同道合的年轻人共同创立了「极创工作室」,踏上了科技创业的旅程。

打造 SwanHub 的灵感,除了来源于团队基于当前 AI 领域对开源社区需求的洞察,其实也和他们自己的研究经历有关。

在从事 AI 研究的过程中,他们常常感受到来自内部协作和项目展示方面的需求和挑战。虽然常用的一些开源平台能够提供基本的托管功能,但往往缺乏一个基于模型的可视化协作版块,导致实验室成员之间的合力难以凝聚。

对于大部分的研究者来说,诸如此类的问题是很常见的。一方面,复杂的实验版本和多人协同带来的困难会限制研究项目的发展,另一方面,模型的部署难度较大以及训练过程的复现困难也阻碍团队的内部交流和知识积累。在日常的学术交流活动中,他们同样缺乏一个直观展示成果和积累的平台。

「这些因素进一步强化了我们搭建一个属于自己的协作和展示平台的愿望。」SwanHub 项目负责人林泽毅介绍说。「我们希望提供一个针对 AI 领域的开源社区,在论文复现、技术选型、技术分享等方面帮助更多的科研工作者与从业者。此外,我们期望这种基于模型的可见、可交互的协作模式能够提高 AI 项目的迭代速度和团队成员之间的交流效率,减少不必要的等待和沟通成本。」

因此,SwanHub 项目的最初设想是提供一套完整的 AI 工作流程,从论文到开源代码再到部署和可视化展示。通过这套工作流程,人们可以在进行实验和投稿论文的同时,轻松地搭建可视化的演示,以供同行快速复现和试验。另一方面,提供可交互 Demo 的学术项目也更容易获得更高的传播度和更好的口碑,进而获得更高的学术影响力。

同时,团队还考虑到了业界开发者的需求。与传统的软件开发不同,AI 开发是一种实验科学,特别是到了大模型时代,技术的开发和测试思路也发生了很大的变化:在实际应用中,尽管模型可能在某些客观指标上表现出色,但如何在实际场景中施展它们的「智能」,如何将它们融入到专业工作流程中,往往需要相关领域的专家进行深入的实际效果测试,而这个过程同样是挑战重重的。

对于这一点,SwanHub 项目成员陈少宏的体会比较深刻。他所在的 AI 研究团队曾经参与一家智能手机厂商视频处理算法研发的项目,当时的研究团队成员分散在全国多个城市,大部分工作需要线上协作。但从算法更新、验证、端侧部署、反馈的整个线上流程来看,每一次模型迭代需要以「1.5 个星期」为单位,显然赶不上项目原本规划的落地节奏。

为了加快算法更新效率,陈少宏推荐研究小组使用了 SwanHub,每训练完一个版本的模型,都可以在平台上快速更新 Demo,厂商各部门的人员,包括 PM、产品经理、测试、市场、其他研究人员,都可以在线试验效果,提供多样化的改进反馈,极大地提高了合作双方的沟通和协作效率,也大大提高了模型的迭代速度。

这种跨学科的协作,在此前以代码为核心的协作上是很难做到的 —— 比如让一位市场部的项目成员去安装环境、运行项目是阻力极大的事情,而以 Demo 为核心的平台让跨领域协作成为了可能。

开源的价值:AI 技术变革的助推力

二十年前,一本名为《开源:革命之声》的著作曾风靡科技圈。这本书深入探讨和记录了十多位开源先驱对于开源文化的理解和阐述,包括 Linux 之父 Linus Torvalds、自由软件运动创始人 Richard Stallman 等传奇人物。

比如,Linus Torvalds 一直是开源的忠实拥护者,曾公开表达:「未来的一切都是开源的(The future is open source everything)。」三十多年来,他不遗余力地为 Linux 社区注入心血,让 Linux 从一个仅有几百位用户的自由操作系统开始,逐渐成长为一个伟大而富有创造力的社区。

SwanHub 的团队成员对于开源的热情就起源于这本书籍,他们甚至尝试将此前只有英文原版的书稿译为中文,翻译的过程让他们更加深刻地认识到开源在学术交流与科技发展中所能发挥的巨大推动作用。

打造 SwanHub 开源社区的深层价值也在于此。纵观今天的 AI 领域,大部分有影响力的进展都深深植根于开放科学和开源的原则。这些原则不仅倡导知识的自由传播和共享,还实质性地推动了全球范围内的科研协作与创新。

Hugging Face 社区的「Transformers 库」便是一个经典的例子:这家成立于 2016 年的公司,凭借其易用的接口和大量的预训练模型迅速获得了 AI 社区的广泛认可和热烈欢迎。它不仅提供了一个用于发布、分享和协作的平台,还开启了一种创新的协作模式,大大降低了深度学习模型的使用门槛,从而让更多的开发者和科研工作者能够应用这些模型到实际的项目和研究中。

最重要的是,Hugging Face 社区鼓励并促进了全球范围内的协作。开发者和研究者们在此平台上分享自己开发的模型、贡献代码、提出问题,共同寻找解决方案。这种集思广益的协作方式极大推动了 AI 技术的发展,也将一些前沿的、可能原本属于封闭研究的技术开放给了公众。

Hugging Face 的成功不是偶然的,它揭示了一个开放、协作的技术社区对于科技进步起到了不可忽视的推动作用。当科研工作者有了公开分享数据、方法论、模型和工具等研究成果的渠道,他们的贡献就能成为广大研究社区的共同财富。

这种开放分享的实践允许其他研究者站在「巨人」的肩膀上,不仅能看到更远的地方,也能通过继续探索和创新。身处这样一个环境中,AI 技术的发展才能够在一个正向循环中迅速推进。

在这一点上,SwanHub 的目标和 Hugging Face 是基本一致的。关于 SwanHub 的未来,团队希望能够持续提升 SwanHub 在协同、部署、社区等方面的能力与体验,并将围绕 SwanHub 打造工具矩阵,包括大模型模块化编程工具 SwanChain、模型实验管理工具 SwanLab 等,覆盖 AI 研究的整个生命周期,并持续走开源道路。

图片

如今,大模型风云乍起,新的成果不断涌现,谷歌和 OpenAI 这样的公司可能不会有「护城河」,而开源力量却在不断崛起和追赶,形成这一局面的因素中,也包括无数开源拥护者的共同努力。

产业SwanHubAI 开源社区平台
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~