利用自己的脸书聊天数据训练 GPT2?小哥教你如何「自说自话」
在 GPT2 应用满天飞的时代,来自 Aristander.ai 的机器学习工程师 Svilen Todorov 发明了一种新的「玩法」。Svilen 在仅仅利用 Google Colab 的情况下如何成功利用自己的脸书聊天数据训练 GPT2 1.5b,实现了自己和自己的对话。Svilen 表示,该方法达到的最终损失(无论价值多少)都刚刚超过 0.6,大大低于较小型号的损失。小哥表示,他的数据集仍然很小-14mb,下一步是从其他来源添加其个人数据。