商汤开源最大目标跟踪库PySOT,代码已正式上线!

前几天 CVer推送一篇:重磅!商汤开源最大目标跟踪库PySOT:含SiamRPN++和SiamMask等算法,介绍了来自商汤科技的STVIR(SenseTime Video Intelligence Research team)开源的目标跟踪库:PySOT。当时PySOT并没有上传代码,所以之前的文章仅介绍了新特性,但得到大家广泛关注。

本以为是2019年5月底会上线代码,但于2019年5月13日凌晨,PySOT已正式上线代码!

https://github.com/STVIR/pysot

之前Amusi也分享了几篇很棒关于目标跟踪很棒的文章,但本文要介绍的项目是paper+code,这个是大家喜闻乐见的。

PySOT特性

PySOT 目标跟踪库实现了目前SOTA的多个单目标跟踪算法,该项目是用Python编写,基于PyTorch深度学习框架。

该项目还包含用于评估跟踪器(tracker)的Python工具接口。

为什么叫 PySOT?大家应该能猜到是:Python/PyTorch + Single Object Tracking 的组合。Amusi 强烈建议后面再开源个 PyMOT,哈哈!

PySOT 共包含 5 种算法:

  • SiamMask   (CVPR 2019)

  • SiamRPN++(CVPR 2019 oral)

  • DaSiamRPN (ECCV 2018)

  • SiamRPN     (CVPR 2018)

  • SiamFC        (ECCV 2016)

SiamRPN++

PySOT 提供 3 种 backbone:

  • ResNet{18, 34, 50}

  • MobileNetV2

  • AlexNet

PySOT 提供的评估工具支持如下数据集:

  • OTB2015

  • VOT16/18/19

  • VOT18-LT

  • LaSOT

  • UAV123

PySOT 安装与测试

最新更新的 PySOT 添加了安装教程、模型下载库、测试/评估脚本等内容。

PySOT 安装&环境依赖

  • Conda with Python 3.7.

  • Nvidia GPU.

  • PyTorch 0.4.1

  • yacs

  • pyyamlmatplotlib

  • tqdm

  • OpenCV

# Create environment and activateconda create --name pysot python=3.7conda activate pysot# Install numpy/pytorch/opencvconda install numpyconda install pytorch=0.4.1 torchvision cuda90 -c pytorchpip install opencv-python# Install other requirementspip install pyyaml yacs tqdm colorama matplotlib cython tensorboardX# Build extensionspython setup.py build_ext --inplace# Try with scriptsbash install.sh /path/to/your/conda pysot

PySOT Model Zoo

Visual Tracking Baselines(Short-term Tracking)

PySOT 工具集:评估

如:VOT2018-LT

测试脚本

cd experiments/siamrpn_r50_l234_dwxcorrpython -u ../../tools/test.py   \  --snapshot model.pth   \ # model path  --dataset VOT2018   \ # dataset name  --config config.yaml    # config file

侃侃

PySOT的代码已经上线,快快测试一下吧~

工程目标追踪商汤科技
53
相关数据
商汤科技机构

作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

OpenCV技术

OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。

推荐文章
赶快学习一下
赶快学习一下
赶快学习一下