第259章 白度大危机(2/2)
天才一秒记住本站地址:[笔趣阁]
https://www.ibqg.vip 最快更新!无广告!
而需要韩辞帮助的原因也很简单,辐射场加上体渲染的组合,全程是可以微分的,需要在数学上做很多处理和计算。
你可以理解为把一个空间向一个方向上拍扁,空间中的颜色加权求和得到平面上的颜色,从三维映射到二维。
“所谓的辐射场,可以看做是一个函数。如果从一个角度往一个静态空间发射射线,我们可以查询这条射线在空间中每个点的密度,以及在这个射线角度下所呈现出来的颜色。传统的辐射场需要维护一个表,根据特定的位置和角度,查询获得颜色值和密度,然后交给体渲染方法去使用和计算。”卡莱尔给韩辞大概科普了一下方法的步骤。
“传统的这种方式有一个很大的问题,查表意味着表的大小和空间的大小正相关。如果我想要表达的空间比较大,这个表的大小规模就会越大,所需要的资源数量会超乎人类的想象,来到一个夸张无比的规模。并且它还是离散表示的。”孟繁岐直接指出了原本办法的最大问题。
“这就像是y=x这条直线,你不使用方程y=x去描述,而是记录(1,1)、(2,2)这些点去表达,复杂度就从1变成了n。你想要描述的范围越大,需要记录的点就越多。而我的想法,就是用深度学习的方式,去近似拟合这个函数,这样就不再需要维护一个庞大的查询表。”
这也就是神经辐射场的名字来由了,其实就是一种基于神经网络的辐射场表达办法。
由于神经网络和体渲染方法都可微分,渲染得出的图像与原本图像的差距就很好计算和传递,直接可以从最终的成果反向传回模型当中,非常方便进行运算。
对于孟繁岐的这番创举,克莱尔心中感到的震撼是非常大的。
在她看来,孟繁岐此前做的什么图像分类、检测、分割都只能算作是模式识别问题,都算不上是真正意义上的【计算机视觉】。
因为神经网络在这些任务上的贡献,都只是分析分析图片里面的模式和特征罢了,对于视觉的本质是根本没有触及到的。
这也是图形学研究者们独特的骄傲了,觉得自己的研究视角更高一层。
计算机视觉领域最高的奖项是【马尔奖】,作为计算机视觉的开创者,马尔提出过一个系统的视觉理论。
他把计算机视觉的终极问题定义为:【输入二维图像,输出由二维图像重构出来的三维物体的位置和形状】。
在马尔看来,如果这个终极问题能够被解决,那么其他的问题都不在话下,要简单许多。
从他的理解来看,图像的识别检测都是小打小闹,从二维到三维的重建才是整个领域最根本核心的问题。
而这个方向的突破和成果,才是视觉领域最根本的进步。