
在 MASK 层引入粗粒度信息,如 whole word mask 或者 ERNIE 1.0;
在嵌入层引入粗粒度信息,如 ZEN 何 AMBert。














Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
既能利用多粒度输入信息,又不降低推理速度,腾讯看点等机构的研究者在一篇 ACL 论文中提出了一种高效的语言模型预训练方法 LICHEE。经过半年多的摸索改进,荔枝 LICHEE 同时登顶 CLUE 分类榜单、阅读理解榜单、总榜单,其相关的技术创新也被 ACL 2021 录用。
在 MASK 层引入粗粒度信息,如 whole word mask 或者 ERNIE 1.0;
在嵌入层引入粗粒度信息,如 ZEN 何 AMBert。