Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

张倩、魔王、杜伟报道

人脸识别、轨迹追踪、3D体感摄影,「百发百中」篮板升级,网友:你怎么那么有钱有闲有知识

还记得那个让你「百发百中」的篮板吗?虽然它已经极大地提高了进球率,但作者似乎并不满意。最近,他又做了个改进版,用上了机器人和计算机视觉技术!他还说,「如果都这样了你还进不了,那只能说你太菜了(you really suck)」。

闭着眼都能「包你进」的智能篮板 2.0。

在上个月发布的一个 YouTube 视频中,一位名叫 Shane Wighton 的小哥展示了一款特殊的篮板。与普通的平面篮板不同,这个篮板是曲面的,每个位置的弧度都经过了周密计算。整个过程利用了蒙特卡罗法和最小二乘法,极大地提高了进球率,视频的播放量也超过了 400 万。


但是,作者本人好像并没有很满意,因为他发现如果你投的球是平飞球(击出之球又直又快),还是很难保证球落到篮筐里。

于是他继续创新。这回,他使用了机器人和计算机视觉!改进后的篮板长这样:

它可以前后、上下、左右来回晃动:

也就是说,当球打在篮板上的时候,篮板会自己调整角度,「想法设法」把球弹到篮筐里。它知道你的球从哪里来、何时来、轨迹是什么样的,因为整个房间都在它的「监控」之下。

然后,它会借助这些信息调整自己的角度帮你进球。

此外,它还知道投球的人是谁,因为上面安装了人脸识别系统。

要做一个这样的篮板有很多困难。首先,篮板需要尽可能灵活,能够上下左右前后灵活转变方位;其次,机械动作的完成要尽可能快,因为从球脱手到击中篮板通常只有 600 毫秒。

他在篮板的后面安装了 3 个小电机,每个电机控制一个连杆,因此这个篮板有三个自由度。由于电机功率较小,所以他选择的篮板质地很轻。


篮板后边用的材料都是金属,借助等离子切割技术切割而成,这部分金属材料大约花了 5 美元。此外,他还用 3D 打印技术做了一些零部件。

完成这些机械制造部分之后,接下来要考虑的是如何让篮板「掌握」投球者的信息。

在硬件方面,Wighton 用到了微软为 XBOX360 打造的 3D 体感摄影机——Kinect。Kinect 可以为软件提供视频输入,视频中带有深度信息,可以表示你和摄像头之间的距离。Wighton 借助这些信息完成球的轨迹追踪。

最难的部分是软件,这花费了作者的大部分时间。Wighton 表示:与软件相比,机械设计部分简直太简单了。

首先,软件需要在视频中找到球,而且要尽可能又快又准。

在视频中,基于单一的帧很难区分出哪个是球,「聪明」的计算机视觉系统把篮球、人头甚至是角落的杂物都当成了球。

于是,Wighton 只能凭借视频中每个物体的轨迹来判断哪个是球。

篮球的轨迹应该是一条平滑的抛物线,Wighton 借助这一物理常识来判断哪个是篮球。

找到球之后,接下来就是预测球的完整轨迹以及球可能打在篮板的哪个位置:

在这个过程中,收集的数据越多,预测就越准确。由于 Wighton 能算出从下达指令到篮板移动的时间,因此他选择在篮球快要击中篮板的最后几毫秒下达指令,这样能大大缩小落点的潜在范围。

算出了这些信息之后,接下来就要讨论如何移动篮板。此处的原理也比较容易理解,如果系统判断篮板该往前移,它就会让篮板适当下压,反之则适当上翘。

当然,移动方案并不是固定的,Wighton 选择方案的标准是:这个方案能做到吗?要花多长时间?整个的计算过程其实是非常复杂的,充满了各种数学方程。

目前,这个篮板还存在一些问题,如 Windows 太慢,有时候会胡乱下指令,还有很多 bug 没有修复…… 这些问题也导致篮板在关键时刻翻车,比如在作者老婆试用的时候:

翻车就算了,还有语音反馈:“you really suck at basketball”。

用到了哪些工具

看了整个过程,你是不是也想动手复现 Wighton 的篮板项目?在复现过程中,你需要这些材料和设备:

首先是篮板。

这回他没有选择手工制作,而是网购了一个。为了达到最佳效果,Wighton 也是拼了!

这次的篮板长这样。

技术制图时,他使用了 13 英寸的 iPad Pro。

实际操作过程中用到的工具更是纷繁复杂,且昂贵……

Wera allen keys 五金工具、马克笔、电焊机、铆接套件、AngleCube 数字量角器、压弯机、20 吨折弯机、无线角磨机、Powermax45 XP 专业级机用等离子切割系统等等。

除了实体硬件和工具以外,知识才是做成这个项目最重要的工具。

书到用时方恨少?不存在的。Wighton 在做这个项目前阅读了以下书籍,从中获得了很多技能:
  • Real-Time Collision Detection

  • Introduction to Algorithims

  • Planning Algorithims

  • Statistics

  • Computational Geometry

这些书籍涉及算法、统计学、计算几何学等等,看来 Wighton 做了相当充分的准备。

网友神评论:别问我记不记得高中几何,问就是不记得!

面对 Wighton 不达目的(百发百中)绝不罢休的精神,网友展开了神评论:

我本来打算吐槽『这个人竟然在这个领域浪费时间,之前那个小哥的木制篮板已经很强了……』然后发现,额,竟然是同一个人做的……

你竟然在几周内就做了这么多?!

这怎么可能?你怎么会具备这么多不同领域的专业知识、这么多昂贵的机器和这么多时间?

这是我第一次不了解一个人做一件事的目的。

这位朋友你说出了我们的心声!

计算机科学系学生也表达了自己的感受:

作为一名计算机科学系的学生,我曾经告诉自己数学无用。但是你的所作所为证明我错了……


更多网友表达了被高中教师支配的恐惧:

你问我还记得高中几何吗?

我只能说:是那个表示形状的几何吗?

你问了很多次「还记得…… 吗」,我对此只有一句回答:「不记得」……

也有网友提出疑问:为什么要在最后一瞬间移动?

Wighton 对此的回复是:

最后瞬间才移动的原因是,估计到的轨迹很容易改变,而这需要方向反转(即它们并不是单调地接近正确解)。如果发生了这种现象,我必须减速直至停下,然后再从另一个方向加速。最糟糕的情况是从一侧移动另一侧。我对此进行了基础分析,发现在最后时刻移动篮板得到的平均结果更好。

方向反转的另一个问题是,从完全正的加速转向完全负的加速会造成双倍的系统冲击(即加速改变率)。这会带来较多的机械振动,导致各种各样的问题。

Shane Wighton 是谁?

Shane Wighton 毕业于北卡罗来纳大学夏洛特分校,获得了机械工程学士学位和计算机科学硕士学位。他目前在 3D 打印技术开发商和制造商 Formlabs 公司担任首席工程师,热爱制作东西。曾发表专利:Additive fabrication support structures(增材制造支持结构)。

Wighton 于 2020 年 3 月开通了自己的 YouTube 频道,短短两个月已经收获了 10 万 + 订阅者。

除了我们介绍的两个篮板视频外,Shane Wighton 的 YouTube 频道中的其他视频也多与「制造」相关。

他在 YouTube 频道简介中这样写道:
我创造各种各样的事物,并且希望用有趣的方式来分享。我的大部分创造是制造项目,不过我也写软件、制作电子设备等。
有那么多人喜欢、分享自己的创造,并给出反馈,是件挺快乐的事吧。

话说回来,Wighton 还打算再接再厉,继续改进,说不定还会有第三版智能篮板呢!

完整视频请戳:


入门蒙特卡罗方法最小二乘法人脸识别
相关数据
最小二乘法技术

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。 利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。 “最小二乘法”是对过度确定系统,即其中存在比未知数更多的方程组,以回归分析求得近似解的标准方法。在这整个解决方案中,最小二乘法演算为每一方程式的结果中,将残差平方和的总和最小化。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

推荐文章
暂无评论
暂无评论~