蒋宝尚编译

一文打尽ECCV 2018大会项目亮点

欧洲计算机视觉国际会议,是计算机视觉三大会议之一。两年一次,每次会议在全球范围论文录用率在20%左右。而本次的会议论文录取率大约在24%左右。

今年的ECCV 2018会议揭示了计算机视觉领域的最新进展。正如所料,所有会议都由卷积神经网络(CNN)的深度学习主导。

下面几个项目,是本次会议的亮点,在一些项目里,我们有的给出了介绍,有的给出了论文的下载地址,感兴趣的同学,请自取哟~

自动驾驶

自主定位飞行

2018年ECCV的主要议题之一是自动驾驶。你能和LIDAR竞争吗?你能从视频中检测和重建汽车为3D物体吗?

下面这个网址将会给你答案

http://apolloscape.auto/self_localization.html

CARLA:自动驾驶研究民主化

在城市地区,自动驾驶需要保证非常安全的驾驶行为。你听说过CARLA模拟器吗?Carla是一个用于自主驾驶研究的开源模拟器。在仿真程度上,Carla使用更方便。

这儿有一份介绍

https://www.youtube.com/watch?v=AaJekfFR1KQ

一种新的神经网络结构与方案

具有自适应计算图的卷积网络

Anreas Veit表示CNN不一定需要固定的前馈结构。相反,他提出了在ImageNet上优于ResNet的自适应网络拓扑结构。

论文摘要

https://towardsdatascience.com/paper-summary-convolutional-networks-with-adaptive-computation-graphs-d3dcad10f565

提升层:分析和应用

如何提高输入的维数在图像分类或去噪领域中的深度学习应用以及更快的训练数据?

这篇论文给你想要的答案。

tp://openaccess.thecvf.com/content_ECCV_2018/papers/Michael_Moeller_Lifting_Layers_Analysis_ECCV_2018_paper.pdf

使用对抗性扰动学习判别视频表示

一文打尽CNN的特点、Stiefel流形、黎曼流形上的共轭梯度算法。

tp://openaccess.thecvf.com/content_ECCV_2018/papers/Jue_Wang_Learning_Discriminative_Video_ECCV_2018_paper.pdf

魔术与图像

通过Disentangled Representations进行图像到图像的翻译

这篇论文里,你会理解如何生成具有特定内容和属性的新图像?

tp://openaccess.thecvf.com/content_ECCV_2018/papers/Hsin-Ying_Lee_Diverse_Image-to-Image_Translation_ECCV_2018_paper.pdf

基于Style-aware Content Loss的实时HD风格转换

这篇论文的作者为图像风格转换问题奠定了基础。它们为我们提供了模仿各种历史艺术家风格的绘画。这些都是由真实世界图像中的CNNs生成的,对人眼来说,有非常高的欺骗率。

tp://openaccess.thecvf.com/content_ECCV_2018/papers/Artsiom_Sanakoyeu_A_Style-aware_Content_ECCV_2018_paper.pdf

烹饪的乐趣!

这有一款名为Cookpad移动应用程序!你可以用它来拍一张美味餐的照片,CNN会识别出来这顿饭。这款应用程序可以告诉你这顿饭的配料是什么,做这顿饭的步骤以及注意事项。

https://www.semanticscholar.org/paper/Deep-based-Ingredient-Recognition-for-Cooking-Chen-Ngo/23fd82c04852b74d655015ff0876e6c5defc6e61

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

理论ECCV 2018
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

推荐文章
暂无评论
暂无评论~