利用机器学习解读日本古文字 Kuzushiji
日本古文字 Kuzushiji 是日本文化的重要组成部分,然而,Kuzushiji 与现代日语的语法以及词汇存在很大的不同,这使得大多数人很难阅读该文字。为了让 Kuzushiji 更加容易被识别,日本国立文学研究所(NIJL)创建并发布了一个 Kuzushiji 数据集,该数据集由人文开放数据中心(CODH)策划,目前含有 4000 多个字符类和一百万个字符图像。研究团队还公布了一个名为 KuroNet 的 Kuzushiji 转录模型。该模型能够以平均时间为每页 1.2 秒的速度转录整个 Kuzushiji 页面,包括未经精心优化的后处理管道。(The Gradient)