你有多久没调过 kernel size 了?虽然常常被人忽略,但只要将其简单加大,就能给人惊喜。
论文地址:https://arxiv.org/abs/2203.06717
MegEngine 代码和模型:https://github.com/megvii-research/RepLKNet
PyTorch 代码和模型:https://github.com/DingXiaoH/RepLKNet-pytorch
用 depth-wise 超大卷积,最好再加底层优化(已集成进开源框架 MegEngine)
加 shortcut
用小卷积核做重参数化(即结构重参数化方法论,见我们去年的 RepVGG,参考文献 [1])
要看下游任务的性能,不能只看 ImageNet 点数高低
小 feature map 上也可以用大卷积,常规分辨率就能训大 kernel 模型