「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。
本文为源码资本投资董事总经理张星辰于「驱动未来的AI技术」系列主题,「可信AI」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。
张星辰表示,目前元宇宙的热度非常高,元宇宙和虚拟世界在概念上有很大区别,可能在虚拟世界定义范围里讨论会更贴切一些。对于元宇宙概念的理解,张星辰表示,元宇宙跟软硬件、操作系统、内容生态、 web 3 和 crypto (加密)都有一些交集。如果站在消费者、用户的需求角度来看元宇宙,元宇宙给我们带来的最大不同是沉浸感或者现场感体验。张星辰对元宇宙核心总结到,不管是投资人还是创业者、同行们,未来的 5 到 10 年,元宇宙虽然会有泡沫,但从现在来看,云宇宙可能是基础设施投资期一个非常大的机会。张星辰强调,虚拟世界或元宇宙的核心表现或者最重大特征是它体验的临场感和现场感。那么AI在元宇宙中可以发挥什么样的作用呢?用一句话总结:AI的主要作用是通过更高效快速的方式帮助我们创造虚拟世界和元宇宙,让虚拟世界或者元宇宙的内容变得更加丰富。不管是对《头号玩家》电影还是3A游戏,它们的研发投入都十分巨大,未来虚拟世界中的虚拟场景和虚拟人,从建模到材质,再到渲染和动作捕捉,每一部分都非常耗费人力和时间,这些不能全部由人去完成。把虚拟世界从科学的角度简单做一下两分法,可以把它分为虚拟人和虚拟场景。在过去,包括学术研究和创业公司、或者像英伟达这样的巨头所提的 omniverse ,大家都试图想去解决3D 重建如何做到更快、更高效、更高质量的问题。简单来说,3D 重建可以理解成是一个反向渲染的过程。比如做一个沙发的模型,需要让模型有材质之后,再通过渲染器渲出它的光效和色彩效果来增强它的内质感。在过去,苹果推出过Object Capture这样的产品去创建3D模型。比如拍照片,做一个桌子,或者一棵树、一个山头,通过拍照的方式对相当大的物品进行3D重建,这些产品都可以进入素材库里,这是一个非常好的办法。基于 AI 技术,3D 重建在最近的研究里也有很多新的做法和进展。如果大家感兴趣的话,可以去看2019年一些关于隐视表达在3D重建里的应用。张星辰介绍道,“神经渲染”对虚拟场景来说也是一个要点。神经渲染可以简单理解为利用神经网络基础去做渲染。关于“神经渲染”的解释,机器之心有很多文章提到过,自己也是机器之心的忠实读者,感兴趣的小伙伴可以翻阅机器之心的文章了解。对于虚拟人的见解。张星辰分享道,从虚拟世界的虚拟内容整体上看,我发现虚拟场景比虚拟人更难解决得多,为什么虚拟人在虚拟世界里那么难解决呢?大家可以想象一下虚拟世界的现场感和临场感体验,比如你在一个虚拟世界里和一个人讲话,对方是机器人或者是一个NPC,只要他在对话里露出破绽,或者表情和动作不自然,他就会表现出非常强的违和感。大家在玩游戏的时候需要一些代入感,接触更多的是虚拟人,虚拟人在本质上第一点需要解决的就是拟人问题。所谓的拟人,不一定要越像真人越好,它可能是一个很夸张的形象,比如说虚拟人大笑时,他的嘴咧到耳朵上去,真人是没有办法做到的,这在虚拟世界里称为动作捕捉和面部表情捕捉。在游戏和动画产业里,过去的做法非常昂贵。而近期如Meta(前Facebook)以及一些中国的创业公司也在开发低成本的动作捕捉方案。最后,张星辰表示,虚拟世界最理想的情况是所有动作和表情可以自动生成,即AI Generate,这是非常难以攻克的技术和产品。随着用户场景和资本的投入,我期待在未来的三年,五年到十年时间里有可能实现动作和面部表情完全AI Generate。另外,虚拟人比较难以攻克的方向在于对话能力,其不仅包含NLP和ASR等常见的AI技术,它还包括大模型、AI强化学习决策能力。