Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

机器之心编辑部机器之心报道

旷视技术分享会首期「开课」:AI多摄助力手机影像突破

AI多摄背后:手机计算摄影的创新之路

10月12日,旷视MegTech Lite漫谈AI技术分享会在北京举行。旷视研究院研究员范浩强以《手机上为什么要有那么多摄像头?》为主题,深入浅出地分析了AI多摄技术的“来龙去脉”,并分享了旷视在AI多摄领域的技术创新和实践成果。

随着科技的进步,手机已经成为身边最为便捷的影像设备,随时随地捕捉和记录着美好生活。调研机构艾瑞咨询发布的《2020中国人工智能手机白皮书——AI重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。随着AI技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的AI计算摄影技术受到了越来越多的关注。

图:旷视研究院研究员范浩强在旷视AI多摄技术分享会上的演讲

用户需求升级,加速AI多摄入局

从2000年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求“所见即所得”的真实性与媲美相机的质感之间的兼顾,开始利用手机进行专业级别的影像创作。

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。通过多个摄像头的协调配合,AI技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI算法已成为多摄像头联动不可或缺的纽带。旷视自2016年起开始研发多摄技术,经过5年多的技术迭代和优化,如今已研发出业界领先的AI多摄算法,并在多款畅销手机机型中实现技术应用落地。

变焦、虚化、融合多摄助力手机影像突破

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。然而,后置摄像头不是越多越好,也不是越大越好。 旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。旷视率先提出“AI重新定义光感知系统”的理念,将光感知系统“硬件升级——算法辅助——优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

面向未来,AI驱动的图像获取

AI多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等AI企业对于底层技术的创新和赋能。以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

随着以多摄为代表的AI计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用AI技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。对于影像世界的美好想象,AI计算摄影,正在帮助我们一步步完成。

关于旷视

旷视是一家聚焦物联网场景的人工智能公司。基于业界领先的基础研究与工程实力,旷视打造出软硬一体化的AIoT产品体系,面向消费物联网、城市物联网和供应链物联网提供行业解决方案,持续为客户和社会创造价值。

了解更多请访问www.megvii.com或关注微信公众号“旷视MEGVII”。

技术分析AI多摄技术旷视
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~