MIT : 近视眼看到会嫉妒,AI在黑暗中视力满分

当你刷朋友圈和微博的时候,总是能看到各种路人撞到玻璃门的搞笑动图。即便是人眼,分辨透明的物体或许都会遇到一些困难。这个问题如果交给AI,它是否能辨别玻璃的存在呢?

图片来源:Pixabay

麻省理工大学的学者们可能也撞过玻璃门,不然很难想象他们为何要给AI布置一个如此高难度的任务。令人惊叹的是,AI的能力超乎了我们的想象。它不仅能成功的辨识透明物体,还超额完成了任务。

麻省理工大学机械工程的学者们运用深度神经网络成功地解决了AI图像辨识的两大难题:黑暗环境下的辨识和透明材质的辨识。更厉害的是,它们的AI系统可以同时完成以上两项动作:在黑暗的环境下辨识玻璃材质的物体,并且对图像中的物体做出精确复原。他们近期刊登于《Physical Review Letters》中的论文,解释了深度学习是如何使AI系统实现上述功能的。

为了测试AI在只有极其微弱灯光下辨识图像的能力,研究人员首先拍摄了一万张不同的、具有类似蚀刻纹样玻璃的图片。为了减少一片一片蚀刻玻璃的繁琐,他们用只有极其微弱光线的调幅器向玻璃上照出各种不同的蚀刻纹样。整个拍摄过程都是在全黑暗的环境下进行的,唯一的光源就是调幅器所产生的不同强度的微光。拍摄照片的时候,研究人员还故意没有对焦。这样处理是为了适当增加光晕以使神经网络能在几乎全黑的照片中感知到物体的存在。同时,虚焦的图片还增加了神经网络准确辨识模糊图像的难度。

至于虚焦是一种什么样的体验,近视眼的同学可以摘下眼镜感受一下。希望你们感受完回来不要打人。不近视的同学可以看下图。

▲AI对玻璃上类蚀刻纹样的还原过程(图片来源:《Physical Review Letters》论文截图)

在一万次的学习之后,研究人员就对AI开始了测试。测试中使用的图片都是全新的图像,玻璃上的纹样包括人像、风景、动物等。研究人员发现,无论AI有没有学习过基本物理定律,都可以很好的对模糊图片中的纹样进行精确的复原。当然,学习过物理定律的AI复原的程度要稍微好一点。

这样研究未来有望在生物和医学领域得以运用,深度学习对接近透明物体的辨识能力可以帮助人们更好地在光线微弱的条件下观察生物的组织和细胞。类似的技术或许可以实现对低清晰度医疗图像的处理,从而减少X光和CT扫描等检查的辐射量,并降低因此产生的致癌风险。这对于有身体检查需求的患者会是一个福音。

希望AI看了这么多高糊图片之后不想打人……

参考资料:

[1] Goy, et al., (2018). Low photon count phase retrieval using deep learning. Physical Review Letters, DOI: 10.1103/PhysRevLetter.121.243902

[2] Deep-learning technique reveals 'invisible' objects in the dark. Retrieved Dec 13, 2018 from https://www.eurekalert.org/pub_releases/2018-12/miot-dtr121118.php

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业深度学习图像识别深度神经网络
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~