➊
#CNN#
#SLAM#
CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction
文章致力于解决目前单目 SLAM 中存在的问题:1. 真实距离的确定,2. 纹理特征较弱情况下稠密深度图像的获取,3. 相机在纯旋转运动情况下立体匹配失效。
文章使用 CNN 网络获取场景深度图像,并与 SLAM 获得的场景深度信息融合,保证了深度图像获取的稳定、准确性以及稠密性。而且,文章通过 CNN 网络获取场景分割结果,完成了首次协同进行场景的 3D 以及语义重建。
文章在两个公开数据集上,对比了 LSD-SLAM、ORB-SLAM、REMODE 算法,验证了文章中算法在:相机位姿精度、三维重建精度、相机旋转运动下算法稳定性方面的优势。
论文链接:https://arxiv.org/abs/1704.03489
推荐人:高增辉,西安交通大学(PaperWeekly arXiv组志愿者)
➋
#个性化#
#多模态#
Attend to You: Personalized Image Captioning with Context Sequence Memory Networks
本文是 CVPR2017 的 paper,以 Instagram 为背景,包括两个任务:预测 image 的 hashtag,自动生成 image caption,工作的亮点在于生成 description 时考虑了个性化,相当于一个个性化的语言模型,模型是 Memory Network 的一个改进版。
代码地址:https://github.com/cesc-park/attend2u
论文链接:https://arxiv.org/abs/1704.06485v1
推荐人:大俊,PaperWeekly 首席客服
➌
#VQA#
#数据集#
Being Negative but Constructively: Lessons Learnt from Creating Better Visual Question Answering Datasets
本文的工作基于一个实验观察,即让机器根据一幅图从包括正确答案的多个候选答案中进行选择,错误答案的设计对于模型的效果至关重要。本文基于此对之前的两个 VQA 数据集进行了改造,重新设计了原数据中的干扰选项,并给出了新的数据集。
数据集地址:http://www.teds.usc.edu/website_vqa/
论文链接:https://arxiv.org/abs/1704.07121
推荐人:大俊,PaperWeekly 首席客服
➍
#RNN#
Learning to Skim Text
RNN 在 NLP 领域非常解决问题,但长久以来 RNN 的训练问题也是一个让人头疼的问题。RNN 将文本中的每个 word 或者 char 依次读入,来进行分类、生成等任务,但其实其中有一些 word 并没有太多的意义。基于此,本文提出了一种所谓的 skim policy,让 RNN 对每个 word 有一个跳过的选择。实验结果表明,训练速度相比传统的 rnn 提升了 6 倍之多,准确率却几乎一致。本文工作来自 CMU 和 Google。
论文链接:https://arxiv.org/abs/1704.06877
推荐人:大俊,PaperWeekly 首席客服
➎
#中文分词#
Adversarial Multi-Criteria Learning for Chinese Word Segmentation
本文是 ACL2017 的一篇 paper,作者来自复旦大学,其中一作是上周刚刚在 PaperWeekly 做了在线分享的陈新驰博士。中文分词是一个经典的基础问题,本文的亮点在于:(1)多标准训练;(2)引用了一种对抗策略来提升效果。
论文链接:https://arxiv.org/abs/1704.07556
推荐人:大俊,PaperWeekly 首席客服
❻
#文本表示#
A Survey of Neural Network Techniques for Feature Extraction from Text
本文是一篇小综述,总结了一些比较经典的文本表示模型,从 n-gram、tf-idf 到 Paragraph Vector Model、Hierarchical Neural Autoencoder 等。本文适合刚刚进入该领域的同学来看。
论文链接:https://arxiv.org/abs/1704.08531v1
推荐人:大俊,PaperWeekly 首席客服