商汤开源最大目标跟踪库PySOT,代码已正式上线!

前几天 CVer推送一篇:重磅!商汤开源最大目标跟踪库PySOT:含SiamRPN++和SiamMask等算法,介绍了来自商汤科技的STVIR(SenseTime Video Intelligence Research team)开源的目标跟踪库:PySOT。当时PySOT并没有上传代码,所以之前的文章仅介绍了新特性,但得到大家广泛关注。

本以为是2019年5月底会上线代码,但于2019年5月13日凌晨,PySOT已正式上线代码!

https://github.com/STVIR/pysot

之前Amusi也分享了几篇很棒关于目标跟踪很棒的文章,但本文要介绍的项目是paper+code,这个是大家喜闻乐见的。

PySOT特性

PySOT 目标跟踪库实现了目前SOTA的多个单目标跟踪算法,该项目是用Python编写,基于PyTorch深度学习框架。

该项目还包含用于评估跟踪器(tracker)的Python工具接口。

为什么叫 PySOT?大家应该能猜到是:Python/PyTorch + Single Object Tracking 的组合。Amusi 强烈建议后面再开源个 PyMOT,哈哈!

PySOT 共包含 5 种算法:

  • SiamMask   (CVPR 2019)

  • SiamRPN++(CVPR 2019 oral)

  • DaSiamRPN (ECCV 2018)

  • SiamRPN     (CVPR 2018)

  • SiamFC        (ECCV 2016)

SiamRPN++

PySOT 提供 3 种 backbone:

  • ResNet{18, 34, 50}

  • MobileNetV2

  • AlexNet

PySOT 提供的评估工具支持如下数据集:

  • OTB2015

  • VOT16/18/19

  • VOT18-LT

  • LaSOT

  • UAV123

PySOT 安装与测试

最新更新的 PySOT 添加了安装教程、模型下载库、测试/评估脚本等内容。

PySOT 安装&环境依赖

  • Conda with Python 3.7.

  • Nvidia GPU.

  • PyTorch 0.4.1

  • yacs

  • pyyamlmatplotlib

  • tqdm

  • OpenCV

# Create environment and activateconda create --name pysot python=3.7conda activate pysot# Install numpy/pytorch/opencvconda install numpyconda install pytorch=0.4.1 torchvision cuda90 -c pytorchpip install opencv-python# Install other requirementspip install pyyaml yacs tqdm colorama matplotlib cython tensorboardX# Build extensionspython setup.py build_ext --inplace# Try with scriptsbash install.sh /path/to/your/conda pysot

PySOT Model Zoo

Visual Tracking Baselines(Short-term Tracking)

PySOT 工具集:评估

如:VOT2018-LT

测试脚本

cd experiments/siamrpn_r50_l234_dwxcorrpython -u ../../tools/test.py   \  --snapshot model.pth   \ # model path  --dataset VOT2018   \ # dataset name  --config config.yaml    # config file

侃侃

PySOT的代码已经上线,快快测试一下吧~

工程目标追踪商汤科技
53
相关数据
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

推荐文章
赶快学习一下
赶快学习一下
赶快学习一下