Reddit 用户建立「这个故事不存在」网站,技术源于 OpenAI 语言模型
一位 Reddit 用户近日采用了 OpenAI 数月前发布的语言模型 GPT-2-small,建立了一个叫「这个故事不存在」的网站 www.thisstorydoesnotexist.com/,现在任何人都可以通过这个网站生成虚假的故事。
该用户也透露了一些训练细节:使用具有 lr = 1e-5 的 Adam 进行 1500 次迭代训练,批量大小为 512 进行训练,top_k = 50,温度= 0.95。训练是通过 GCP 上的两个 n1 实例,一个带有 K80 的 n1 实例,以及一个带有英伟达 1080Ti GPU 的台式计算机。