# 空间变换网络

• 参数预测：Localisation net

输入：特征图

• 坐标映射：Grid generator

可以得到输出特征图的坐标点对应的输入特征图的坐标点的位置。计算方式如下：

• 像素采集：Sampler

利用期望的插值方式来计算出对应点的灰度值。以双向性插值为例，计算公式如下：

Jaderberg, M., Simonyan, K., & Zisserman, A. (2015). Spatial transformer networks. In Advances in neural information processing systems (pp. 2017-2025).

## 发展历史

2010年，Siddhartha Puri 开始研究神经网络的图像处理方向。

2015年，Mrinal Haloi 将STN用于信号灯的识别，这是STN的首次应用。

2016年，Xu Jia等提出了STN的分支动态过滤网络（Dynamic filter networks）。

2017年，Anil Bas等在STN的基础上提出了3D形变模型（3DMM-STN），将STN的发展从2D提升到3D。

### 主要事件

 年份 事件 相关论文/Reference 2010 Siddhartha Puri 开始研究神经网络的图像处理方向。 Puri, S. (2010). Training convolutional neural networks on graphics processing units. U.S. Patent No. 7,747,070. Washington, DC: U.S. Patent and Trademark Office. 2015 Max Jaderberg，Karen Simonyan和Andrew Zisserman 首次提出STN的概念并详细描述。 Jaderberg, M., Simonyan, K., & Zisserman, A. (2015). Spatial transformer networks. In Advances in neural information processing systems (pp. 2017-2025). 2015 Mrinal Haloi 将STN用于信号灯的识别。 Haloi, M. (2015). Traffic sign classification using deep inception based convolutional networks. arXiv preprint arXiv:1511.02992. 2016 Xu Jia等提出了STN的分支动态过滤网络 Jia, X., De Brabandere, B., Tuytelaars, T., & Gool, L. V. (2016). Dynamic filter networks. In Advances in Neural Information Processing Systems (pp. 667-675). 2017 Anil Bas等在STN的基础上提出了3D形变模型. Bas, A., Huber, P., Smith, W. A., Awais, M., & Kittler, J. (2017, August). 3d morphable models as spatial transformer networks. In Proc. ICCV Workshop on Geometry Meets Deep Learning (pp. 904-912).

## 发展分析

### 未来发展方向

STN不需要关键点的标定，能够根据分类或者其它任务自适应地将数据进行空间变换和对齐（包括平移、缩放、旋转以及其它几何变换等）。在输入数据在空间差异较大的情况下，这个网络可以加在现有的卷积网络中，提高分类的准确性。

Contributor: Tiange Wang