
过去的机器学习工作通常要从头开始训练算法,而结果一般性能有限。 大模型训练与传统机器学习有很大不同,前者系统工作量很大,进而分裂出一种新角色,专注于在超级计算机上对 Transformer 进行大规模训练。 从数字上看,AI 工程师的数量可能会比机器学习工程师 / 大模型工程师多得多。 你无需接受任何训练就可以成功担任这一角色。




模型上,有从最大的 GPT-4 和 Claude 模型,到开源的 Huggingface、LLaMA 和其他模型; 工具上,从最流行的链接、检索和矢量搜索工具(如 LangChain、LlamaIndex 和 Pinecone)到新兴的自主代理领域(如 Auto-GPT 和 BabyAGI); 技术上,每天新提交的论文、模型和技术的数量随着兴趣和资金的增加而呈指数级增长,以至于了解这一切几乎已是一项全职工作。





