Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

OpenAI停服,国产大模型免费用!开发者Token自由实现了

今天凌晨,OpenAI 突然宣布终止对中国提供 API 服务,进一步收紧国内开发者访问 GPT 等高水平大模型。国内开发者真是太难了。

图片

好在,随着开源大模型水平越来越高,开发者已经有很多不错的 “平替”,比如 Qwen2、DeepSeek V2 等模型。为了给开发者提供更快、更便宜、更全面、体验更丝滑的开源大模型 API,AI Infra 领域的专业选手硅基流动(SiliconFlow)上场,推出了一站式大模型 API 平台 SiliconCloud。

刚刚,硅基流动为国内开发者献上一份前所未有的大礼:Qwen2 (7B)、GLM4 (9B)、Yi1.5(9B)等顶尖开源大模型永久免费

从此,开发者 “Token 自由” 不再是梦,可以甩开膀子开发超级应用了。

“Token 自由” 传送门,一键直达:

cloud.siliconflow.cn/s/free

图片

正如在工业化时代,机械化工厂推动了大规模生产商品的效率。在大模型时代,生成式 AI 应用的繁荣亟需高性价比的 Token 生产工厂。

通过云服务接入大模型 API 已成为开发者的最优选择。不过,很多平台只提供自家大模型 API,不包含其他顶尖大模型,同时,在模型响应速度、用户体验以及成本方面,远不能满足开发者的需求。

现在,硅基流动的超级 Token 工厂 SiliconCloud,让开发者不用再花费精力部署大模型,大规模降低 AI-Native 应用开发门槛与成本。

大模型 Token 工厂

即时上新、极速输出、价格亲民

既然叫 Token 工厂,那用户喜欢的模型就都能直接在 SiliconCloud 上找到。

最近,大模型社区相当热闹,开源模型不断刷新着 SOTA,轮流霸榜。

硅基流动第一时间将这些大模型快速上架到 SiliconCloud,包括最强开源代码生成模型 DeepSeek-Coder-V2,超越 Llama3 的大语言模型 Qwen2、GLM-4-9B-Chat、DeepSeek V2 系列模型。还支持 Stable Diffusion 3 Medium、InstantID 等文生图模型。

值得一提的是,对 DeepSeek V2 等部署难度极高的模型,SiliconCloud 是除官方之外唯一支持这些开源大模型的云服务平台。

考虑到在不同应用场景下需要选择适合的大模型,开发者可在 SiliconCloud 自由切换。

图片

这样的开源大模型聚合平台,已经为开发者提供了不少便利,但还远远不够,作为世界顶级的 AI Infra 团队,硅基流动致力于将大模型部署成本降低 10000 倍。

要实现这一目标,核心挑战是如何大幅提升大模型推理速度。对此,SiliconCloud 做到了什么程度?

直观上图,感受一下 Qwen2-72B-Instruct 在 SiliconCloud 上的响应速度。

图片

刚开源不久的 SD3 Medium 的生图时间在 1s 左右。

图片

这些开源大模型的响应速度变快,相同的算力的产出更高,价格自然就打下来了。

SiliconCloud 上的大模型 API 价格也(很卷)更为亲民。即使是 Qwen2-72B,官网显示只要 4.13 元 / 1M Token。新用户还可免费畅享 2000 万 Token。

开发者评价:“速度快得再也回不去了”

SiliconCloud 一经发布,不少开发者就在各大社交平台分享了使用体验。部分 “自来水” 用户是这样评价的:

知乎上,机器学习系统专家 @方佳瑞称赞了 SiliconCloud 的输出速度,“用久了就受不了其他大模型厂商 web 端的响应速度”。

图片

微博用户 @祝威廉二世称,其他几家平台都不敢放 Qwen2 大规模参数的模型,SiliconCloud 都放了,速度很快,还很便宜,一定会付费。

他还提到,大模型的最终产物是 Token,未来会由硅基流动这样的 Token 工厂,或 OpenAI、阿里云这样的大模型企业或云厂商完成 Token 的生产。

图片

还有 X 用户强烈推荐 SiliconCloud,体验太过丝滑,尤其还有体贴周到的一流售后服务团队。

图片

微信公众号博主评价:SiliconCloud 是国内同类产品中体验最好的一家。

图片

这些评价有一个明显的共性,他们不约而同地提到了 SiliconCloud 平台的速度。为什么它的响应这么快?

答案很简单:硅基流动团队做了大量性能优化工作。

早在 2016 年,硅基流动的前身 OneFlow 团队就投身大模型基础设施,是世界上做通用深度学习框架的唯一创业团队。再次创业,他们基于丰富的 AI 基础设施及加速优化经验,率先研发了高性能大模型推理引擎,在某些场景中,让大模型吞吐实现最高 10 倍加速,该引擎也集成到了 SiliconCloud 平台。

换句话说,让开发者用上输出速度更快、价格实在的大模型服务,是硅基流动团队的拿手绝活。

Token 自由后,现象级应用还远吗?

此前,阻碍国内开发者开发 AI 应用的一大因素是不方便访问高水平大模型,即便做出了优质应用也不敢大规模推广,因为烧钱太快,他们无力承受。

随着国产开源大模型不断迭代,以 Qwen2、DeepSeek V2 为代表的模型已足够支持超级应用,更重要的是,Token 工厂 SiliconCloud 的出现能解决超级个体的后顾之忧,他们不用再担心应用研发与大规模推广带来的算力成本,只需专注实现产品想法,做出用户需要的生成式 AI 应用。

可以说,现在是超级个体开发者与产品经理的最佳 “掘金” 时刻,而 SiliconCloud 这个好用的掘金工具已经为你准备好了。

再提醒一下:Qwen2 (7B)、GLM4 (9B) 等顶尖开源大模型永久免费。

欢迎走进 Token 工厂 SiliconCloud:

cloud.siliconflow.cn/s/free

产业硅基流动OpenAI
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
OneFlow机构

一流科技是一家集生产、 研发和销售为一体的创新型人工智能领域创业公司。主营产品是具有完全自主知识产权的分布式深度学习框架OneFlow,同时也提供集算力算法、数据管理于一体的一站式的机器学习平台。OneFlow支持进行大规模分布式训练,支持市场主流硬件芯片和算法。作为企业级人工智能深度学习引擎,OneFlow支持私有云部署和公有云部署,可通过软件平台提供线上自动化的模型训练服务,也可提供定制化的一站式人工智能解决方案。公司创始人为袁进辉,清华大学博士、博士后,师从中国人工智能泰斗张钹院士,研究方向为计算机视觉及机器学习

https://www.oneflow.org
相关技术
语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

推荐文章
暂无评论
暂无评论~