你有没有想过,有一天,码农是不需要写代码的。你只需要提供函数签名和注释,代码就能自己在屏幕上打出来。「搬砖码农可以都辞退了,留下项目经理提需求即可,大雾!」
![](https://image.jiqizhixin.com/uploads/editor/d0102835-324c-4a5a-8364-b81c3c6dfd03/640.gif)
上面这段 demo 是不是看着很爽?这就是 OpenAI CEO Sam Altman 刚刚介绍的最新研究成果——根据函数签名和注释,利用语言模型自动生成 Python 代码。这个语言模型用到了和 OpenAI 的 GPT 模型相同的无监督技术。为了让模型学会「写代码」,研究人员在微软的超级计算机上,借助数千个开源 GitHub 库里的代码对该模型进行了微调。研究人员首先展示了一个较为简单、使用 Python 编写回文检测的例子。回文指的是「正读反读都能读通的句子」,例如:「anna」、「level」等。下面是使用该模型自动生成的代码:![](https://image.jiqizhixin.com/uploads/editor/54dfb227-722e-4305-adf5-ad21e45d807a/640.gif)
可以看到,在你输入了函数签名和注释之后,模型正确地生成了回文检测的代码。当然,对于回文检测,我们也可以用如下更「秀」的递归方法来实现:![](https://image.jiqizhixin.com/uploads/editor/cb0d9716-45f1-4d5b-8b94-70b552dde1e2/640.png)
看到这里,也许大家并没有对该模型的效果感到很惊艳,毕竟像回文检测这类基础任务的代码网上一抓一大把,模型大可以直接从训练集中复制过来即可。接下来,研究人员要求模型生成从一个列表中查找长度不少于 7 个字符的代码,而且该任务并没有在训练集中。我们来看看在这样的情况下,模型表现如何:![](https://image.jiqizhixin.com/uploads/editor/8699abe2-12ae-4b4b-a05c-7167a03f9285/640.gif)
从这个例子我们可以确定,模型不是简单地复制网上的现成代码,而是依据函数名及相关注释产生了对应的解决方案,它甚至还使用了之前生成的代码。试过了单一函数的例子,研究者还展示了其在类中的运行效果。![](https://image.jiqizhixin.com/uploads/editor/8be8ba5d-2e86-4d25-ad0f-2964d84a2f0a/640.png)
这次的任务是计算商品的总价格,并对名称是回文的商品打折。我们来看一看该模型生成的代码:![](https://image.jiqizhixin.com/uploads/editor/5d8b7b92-9364-41b4-bcb6-75c7dc57e17e/640.gif)
模型自动地为我们生成了计算商品总价方法的注释及对应代码。然而这并不是我们想要的结果,我们只想要对名字是回文的商品打折,而不是对所有商品都打八折。研究人员之后修改了该方法的注释,详细描述了想要实现的功能。修改注释后,该模型生成的代码如下:![](https://image.jiqizhixin.com/uploads/editor/95892d9e-896b-4ea3-a558-c7a0b93fc9e4/640.gif)
可以看到模型几乎生成了我们想要的结果。这里仅有一个小问题,我们想要对回文名称的商品打八折,而不是打二折,简单修改一下即可。![](https://image.jiqizhixin.com/uploads/editor/29195b19-b836-490f-ab72-be04bf5313d6/640.gif)
OpenAI 放出的 demo 的确惊艳,甚至是革命性的。如果照这个思路走下去,以后简单的「搬砖工」似乎都不需要了。但问题也出在这儿:效果未免太惊艳了,让人不禁怀疑是否存在造假或精心挑选……![](https://image.jiqizhixin.com/uploads/editor/756ae52f-bef5-4533-a09e-3b2c80175fa1/640.png)
不过也有人说,「这可是 OpenAI!他们的口袋里有的是好玩意儿。」![](https://image.jiqizhixin.com/uploads/editor/819a6fb5-7aba-43ef-9878-9c49b46e86f9/640.png)
![](https://image.jiqizhixin.com/uploads/editor/3c985a42-70b0-4fd8-9a3e-9a3a344ca592/640.jpeg)
在 AI 领域,每种新鲜技术的出现似乎都会掀起一番「XX 从业者是否会被 AI 取代」的讨论,这次也不例外。![](https://image.jiqizhixin.com/uploads/editor/097bc065-43ba-4651-9698-dce23f4fbf8c/640.jpeg)
首先,这种工具的出现所带来的效率提升是毋庸置疑的。我们假设这个 demo 是没有掺水的,那么公司可能会出于成本的考虑裁掉一些初级码农,用一个码农来充当「审码员」,完成原来十个码农的工作。![](https://image.jiqizhixin.com/uploads/editor/9fae2e22-70b2-439f-9161-883ee5a22d91/640.png)
也有人认为,就目前这个模型来讨论程序员是否会被取代未免有点超前。首先,这还只是一个语言模型,即使在非常简单的函数中也可能出错,更别说遇到比较难以理解的自然语言注释语句了。这时候,还是需要人来介入。![](https://image.jiqizhixin.com/uploads/editor/62aecbe6-d698-4245-a85d-a9ba17eaa603/640.png)
其次,这一流程中用到的「注释」还不是需要人来写吗?![](https://image.jiqizhixin.com/uploads/editor/5fb39f46-aa57-40db-9b2d-3e43892ae89c/640.png)
但也有人认为,这些都可以通过时间和技术来解决:总有一天,模型犯的错误会越来越少,甚至少于检查代码的那个人类。![](https://image.jiqizhixin.com/uploads/editor/98a9f4a4-8f82-4f8c-9f2f-df32ef66b044/640.png)
或者你再训练一个模型来写单元测试,然后不断对其进行改进,直到它可以给出大部分时候合理的解决方案。![](https://image.jiqizhixin.com/uploads/editor/ef0bf73b-4295-45b9-b1ac-870df238dd4e/640.png)
当然,这些都是一些非常超前的假设,现在的技术还很难做到,真正应用起来也会有各种各样的问题。但回想起 19 世纪初期大批纺织工人的命运,这种讨论还是很有意义的。参考链接:https://www.reddit.com/r/MachineLearning/comments/gnmjki/dn_microsoft_demos_language_model_that_writes/