Loading... [Link](https://arxiv.org/abs/1802.09987) - 提出了一种新颖的深度形状解释方法,通过在二维中将物体的规范视图建模为深度图来捕捉其结构,称之为多视图分解(MVD)框架。 - 通过利用许多二维正交投影来捕捉形状,以这种方式表示的模型可以通过在二维空间中执行语义超分辨率来扩展到高分辨率,更高分辨率的深度图最终被合并为高分三维物体 NeuraIPS2018 的文章。现在看来是有点老了,但是其提供的视角还是很不错。首先因为一般的场景图片会包含背景(景深)和物体(景浅),那么如果直接对这个场景重建的话,效果不一定好(例如边缘模糊,重影)。如果用分割+mask来重建的话,可能会引入额外的计算消耗 考虑到景深景浅的问题,那么一个场景图片的深度图也应该是至少双峰的。那么如果我们对景深和景浅分别重建,然后再考虑拼接,实际上这是类似于自带 segmentation 的效果的。因此,这篇工作本人觉得 work 的点主要在这里。 [组会汇报](https://tony102.com/usr/uploads/2024/05/755926702.pdf) 最后修改:2024 年 05 月 28 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 1 如果觉得我的文章对你有用,请随意赞赏