Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

PaperWeekly

COLING 2020 | CharBERT:字符敏感的预训练语言模型
COLING 2020 | CharBERT:字符敏感的预训练语言模型

本文最突出的一个地方在于考虑了更好的 embedding 方法,而不是只使用 BPE 的结果,通过结合字符级别和词级别的信息实现了更为全面的输入编码,同时,结合 RNN 和 CNN 的优势也是本文的另一个亮点,基本上 CNN,RNN,Transformer 都使用上了,也体现了新老研究成果的结合在一定程度上能进一步提升方法的性能,可以认为是一个可行的研究方向。

那个屠榜的T5模型,现在可以在中文上玩玩了
那个屠榜的T5模型,现在可以在中文上玩玩了

本文回顾了一下 Google 去年发布的 T5 模型,然后介绍了最近发布的多国语言版的 mT5,最后介绍了如何在 bert4keras 中微调 mT5 来做中文任务,结果显示 mT5 在中文生成上有着很不错的表现,值得做文本生成任务的同学一试。

大规模图训练调优指南
大规模图训练调优指南

最近对一个大规模的图训练嵌入,发现相关的中文资料还是很欠缺的,把自己踩的一些坑记下来。本文主要针对 DGL [1] 和 PyTorch [2] 两个框架。