达摩院「95 后」实习生在常识QA领域的权威数据集CommonsenseQA上刷新世界纪录

近日,阿里 AI 在常识 QA 领域的权威数据集 CommonsenseQA 上刷新世界纪录,超过微软取得第一名,显著提升 AI 的常识推理能力。这一技术是「95 后」实习生叶志秀在达摩院科学家指导下完成的实习成果。CommonsenseQA 是为了研究基于常识知识的问答而提出的数据集,比此前的 SWAG、SQuAD 数据集难度更高。目前最流行的语言模型 BERT 在 SWAG、SQuAD 上的性能已经接近或超过人类,但在 CommonsenseQA 上的准确率还远低于人类。