Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷

数数每天几个小时?

为什么是 OpenAI 率先打造出了 Sora?

现在全世界不论研究员、工程师还是投资人都在问这个问题。

最近几天,人们对于视频大模型 Sora 的讨论热度持续升高,信息早已破了圈,相关的投资热点都已经出现了两轮。

图片

                               Sora 生成的「Flower tiger」视频。试问这种生成能力会催生多少新脑洞?

在一篇文章中,加州大学伯克利分校计算机科学博士、知乎作者 @SIY.Z 分析了 OpenAI 成功的一些原因,包括:

  • 目标和商业模式明确:目标就是 all in AGI,一切研究围绕着探索通往 AGI 的路径;商业模式就是 SaaS,直接给 API。

  • 方法论明确:包括 The bitter lesson(源自 Rich Sutton 的经典文章《苦涩的教训》,核心观点是:人工智能如果想要长期获得提升,利用计算能力才是王道)、Scaling Law、Emerging properties 等。

@SIY.Z 总结说,「OpenAI 采取的商业模式以及其对于 AGI 的信奉、系统性的方法论以及积极的尝试,都在推动他们朝着实现通用人工智能的目标前进,实现了一种可以跑通所有 AGI 技术栈的模式,而这一点,是 OpenAI 能在众多研究机构和公司中脱颖而出的重要因素。」详情请参见知乎原贴。

图片

                               知乎原贴地址:https://www.zhihu.com/question/644486081/answer/3398751210?utm_psn=1743584603837992961

除此之外,我们知道,人才的聚集也是 OpenAI 成功的一个重要因素。这些人才在 OpenAI 是怎么工作的?天才们是不是不需要花多大力气就能做出 ChatGPT、Sora 这种领先的技术成果?答案似乎是否定的。

图片

今天凌晨,OpenAI 研究人员 Jason Wei 自曝的每日工作时间线在社交网络上被疯传。

Jason Wei 本科毕业后加入谷歌,还以一作身份写出了「思维链」的开山之作,现在在 OpenAI 参与打造 ChatGPT。

我们按时间顺序来看一下这个作息表。

早上看起来很正常:

  • 9 点起床;

  • 9 点半乘 Waymo 无人驾驶车去公司,然后吃点牛油果吐司当早饭;

  • 9 点 45:背诵 OpenAI 章程(核心是确保通用人工智能造福全人类),向最优化的神祷告,学习《苦涩的教训》;

  • 10 点用 Google Meet 开会,讨论怎么在更多数据上训练更大的模型;

  • 11 点写代码,用来在更多数据上训练更大的模型;

  • 12 点去食堂吃午饭(素食,无麸质);

图片

下午开始增加工作强度:

  • 1 点继续训练模型;

  • 2 点调试基础设施问题;

  • 3 点监控模型训练,顺便玩一下 Sora;

  • 4 点对前面提到的训练的模型进行提示工程;

  • 4 点半休息一下,坐在牛油果椅子上,想知道 Gemini Ultra 到底有多好;

  • 5 点进行头脑风暴,思考改进模型的潜在算法;

  • 5 点 05 得出结论:改变算法风险太大,只扩展计算和数据更安全;

  • 6 点吃晚饭;

  • 7 点通勤回家。

然后和很多人一样,夜幕降临,生产力最高的时间段来了:

  • 8 点喝杯酒,继续写代码,此时达到鲍尔默峰值(传说中微软在 80 年代末发现的定律,即程序员在血液酒精浓度在 0.129%~0.138% 时会产生超人的编程能力);

  • 9 点:分析实验运行;

  • 10 点:开始实验,让其整晚运行,第二天早上拿结果;

  • 凌晨 1 点:真正开始运行实验;

  • 1 点 15 就寝。默念「Compression is all you need」。

信息量很足,除了学 CEO 奥特曼吃素、揶揄 Teams 不好用之外,看来 OpenAI 的工程师们也极为关心自己竞争对手的动向。

Meta FAIR 研究院研究员、高级经理田渊栋看完以后表示:都说国外没有 996,其实真正可怕的是自我驱动的卷。

图片

上周末,DiT 论文作者之一的谢赛宁在辟谣自己不是 Sora 作者的同时,也透露了一点项目领头人 William (Bill) Peebles 等人在打造 Sora 时工作强度的信息:

图片

「每天基本不睡觉高强度工作了一年。」

上周三,已经二进宫 OpenAI 的知名 AI 学者 Andrej Karpathy 再次宣布离职,这次只待了一年。虽然他表示「没发生什么特别的事情」,不过在第二天又秀了一下日程表:

图片

让人感觉到溢出屏幕的轻松。

只有产品上线之前的一线工程师才这样吗?并不是。引爆了生成式 AI 的 ChatGPT 项目虽然人数众多,但从上到下都卷得令人生畏。在去年 OpenAI 风头压得谷歌等公司喘不过来气的时候,这家公司的信任与安全主管 Dave Willner 却在领英上自宣辞职,原因就是「太卷了」。

图片

Willner 在 7 月 20 日发布的一个帖子上表示,将辞去 OpenAI 高管职务,优先考虑工作与生活的平衡,辞职是一个「相当容易做出的选择」。

他表示,虽然领导 OpenAI 安全项目的工作是「当今最酷、最有趣的工作之一」,但自从 2022 年 2 月加入该公司以来,他的工作范围和规模大幅增长。自从 ChatGPT 推出以来,将家庭需求置于工作之上已变得越来越困难。

Willner 的声明得到了同行们的一致支持,包括那些在 Meta、谷歌和 AirBnb 担任管理职务的人,评论者们认为 Willner 辞职的选择明智且鼓舞人心,并表示他勇敢地公开了自己不断变化的优先事项。

随后的故事我们已经知道了:谷歌 Gemini 继续追赶,上个星期,Sora 再次扩大了 OpenAI 的领先优势。

图片

看起来,天下没有免费的午餐。

选对方向,坚持信念,向着 AGI 的目标前进,OpenAI 这些年的起起伏伏向我们生动展示了一家前沿研究机构该有的样子。

参考内容:

https://twitter.com/_jasonwei/status/1760032264120041684

https://twitter.com/minchoi/status/1759932670782410880

https://www.businessinsider.com/open-ai-sam-altman-daily-routine-schedule-for-productivity-2024-1

https://www.businessinsider.com/openai-chatgpt-exec-resigns-work-life-balance-time-with-kids-2023-7

产业SoraOpenAI
相关数据
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

田渊栋人物

田渊栋,Facebook人工智能研究院智能围棋、星际争霸项目负责人。

推荐文章
暂无评论
暂无评论~