10月13日,倍赛科技CTO刘世林博士在直播活动中带来了以《释放数据潜力,打造AI加速引擎》为主题的精彩分享,一起探讨如何使用人工智能来加速多模态训练数据的处理和准备。
以下是本期分享内容的精彩摘要,想要了解更多内容,可以点击阅读原文观看直播回放。
1、Xtreme1平台介绍
·Xtreme1首次引入本体Ontology的概念,用来抽象和定义不同AI客户之间的问题,更好的实现问题的共享和融合,从而提速模型的开发速度。
·支持全类型的数据需求,从图像数据到应用广泛的激光雷达数据和2&3D融合数据,为自动驾驶和智能家居等行业提供了有力的数据支撑。
在Data-centric MLOps的背景下,Xtreme1对数据治理提出了更高的要求并投入了大量的研发力量,力求通过对数据集管理、数据筛查和数据审核等模块的全新设计来提升整体数据治理效率。
下图为点云连续帧多视图快速质检功能的演示
· Xtreme1提供多个入口对接模型推理服务,现已集成了实时和离线推理的能力,可自由调用模型用于提升标注效能。
图片类调用模型演示
2、利用AI提效
Xtreme1大规模使用AI技术用于提升数据在各个环节的处理能力。
刘世林博士从数据效能、模型效能和业务效能三个板块来解析如何通过AI的能力辅助产品功能。
首先是数据效能,针对自动驾驶领域的数据,可实现2D框、3D框、图像及点云分割等功能的自动化识别。相当于在标注员标注数据之前,按照异步的计算方式完成数据及模型的预测,提高标注效率。
提供相对灵活的人机交互方式来实现半自动标注,减少机器的误差以达到效率与准确率的平衡。
不同相机和雷达之间的数据需要进行信息对齐以满足多模态数据的处理要求。可利用自动或半自动化的方式实现多传感器、多摄像头之间参数的矫正和信息对齐。
寻找最具性价比的训练数据而非全量数据,用更少的标注成本,实现相似的建模效果,以达到AI建模降本增效的目的。
现如今激光雷达数据缺乏语义信息,而数据分辨率低也会导致数据的稀疏,还有常见的遮挡问题,Xtreme1计划在未来使用3D重建的技术,来重构3D点云缺失的一些语义信息,加强多模态数据处理的能力和效率。
其次是模型效能部分,Xtreme1未来会集成主流开源模型,并利用现已积累的三万多个数据集,将重要行业的应用场景数据转化成预训练模型,从而提高标注效率和质量。
Data-centric MLOps的背后需要合适的算法做支撑,Xtreme1也将持续跟进主流算法,集成到平台并保持更新。
同时Xtreme1提供了低代码,开放API,SDK对接,K8s调度等快速建模的手段,以及模型的调试和推理,实时支持生产数据的流入。
最后是任务效能部分。
除了之前分享过的本体功能加速问题定义效率以外,Xtreme1还会提供多人协同,用户画像等功能加速任务执行的效率。
3、点云算法解析
Xtreme1为了拥有更好的适应性,选择了基于CenterPoint的纯点云算法,相比于anchor,预测会更加准确,CenterPoint可先预测中心再回归尺寸和方向,对物体旋转处理不当的问题进行了有效的改善。而模型规模小的特点,也使其推理速度更快。另外,CenterPoint的效果也经过了多个开源实现的验证。
框架选择
MMDetection3D框架是模块化的设计,将Data和Model进行了模块化分离,在模型内部可自由切换backone、neck和head等。同时框架也提供了多种开源模型,基本覆盖主流模型,一次对接后,使得后续模型的新增变得更加容易。
MMDetection3D的更新频率高,推理接口丰富,且开源社区活跃,有大量学术机构和企业的支持。
工程化改造
开源项目在工程化实践中依然遇到很多问题。首先推理服务与模型训练存在天然的资源使用差异,需要对接口进行改造。另外,在工程化应用过程中需要考虑实际数据兼容性的问题,包括数据存储、传输和解析等方面的效率。Xtreme1将文件进行标准化格式输出,同时过滤模型推理中不太重要的信息,从而数据加载提升了百倍的效率。
效果优化方面,虽然原始模型的目标与预识别提效是正相关的,但我们更关注在数据的准确率上,在不改变模型的前提下,会进行少量的后处理,例如NMS的改造,支持动态阙值调整,进而减少了10%的误召回。
模型部署优化,Xtreme1集成了CI&CD,方便扩缩容,实现自动化构建和部署。
欢迎您访问Xtreme1在GitHub的仓库,点亮星星是对我们最大的支持!
https://github.com/basicai/xtreme1/
如果您遇到了一些问题,欢迎在交流群讨论或者通过提issue的方式告诉我们,我们一定会帮到您