📝 学术论文

Arxiv
sym

High-Fidelity Mask-free Neural Surface Reconstruction for Virtual Reality

Haotian Bai, Yize Chen, Lin Wang

项目主页 | 视频 |

  • 一种新颖的基于渲染的神经隐式表面重建框架,旨在无需多视角物体掩码的情况下恢复紧凑且精确的表面。
  • 由于图像中的重叠区域隐式地标识了用户想要捕获的表面,Hi-NeuS利用多视角渲染权重以自监督方式指导神经表面的有符号距离函数。
Arxiv
sym

CompoNeRF: Text-guided Multi-object Compositional NeRF with Editable 3D Scene Layout

Haotian Bai, Yuanhuiyi Lyu, Lutao Jiang, Sijia Li, Haonan Lu, Xiaodong Lin, Lin Wang

项目主页 | 视频 |

  • 一种新颖的框架,通过整合文本描述与基于框的空间布局来合成连贯的多物体场景。
  • CompoNeRF专为精度和适应性而设计,允许用唯一提示颜色表示的单独NeRF进行组合分解重组,从而在分解后从缓存模型简化复杂场景的构建。
ICCV 2023
sym

Dynamic PlenOctree for Adaptive Sampling Refinement in Explicit NeRF

Haotian Bai, Yiqi Lin, Yize Chen, Lin Wang

项目主页 | 视频 |

  • 一种更紧凑且更丰富的PlenOctree (POT) NeRF表示。
  • 创新点:POT用于直接优化的固定结构是次优的,因为场景复杂度随着缓存颜色和密度的更新不断演变,需要相应地细化采样分布以捕获信号复杂度。
  • 性能:DOT在NeRF-synthetic和Tanks and Temples数据集上超越POT,提升了视觉质量,参数量减少超过55.15%/68.84%,帧率提升1.7/1.9倍。
CVPR 2023
sym

Patch-Mix Transformer for Unsupervised Domain Adaptation: A Game Perspective

Jinjing Zhu*, Haotian Bai*, Lin Wang

项目主页 | 视频 |

  • 被选为CVPR (亮点)论文(前2.5%
  • 大域差距:PMTrans通过中间域以相对平滑的方式连接源域和目标域。
  • 博弈论:将UDA解释为一个包含三个参与者(特征提取器、分类器和PatchMix)的最小-最大交叉熵博弈,以寻找纳什均衡。
  • 性能:PMTrans在Office-Home上超越基于ViT和CNN的最优方法+3.6%,在Office-31上+1.4%,在DomainNet上+17.7%。
ECCV 2022
sym

Weakly Supervised Object Localization via Transformer with Implicit Spatial Calibration

Haotian Bai, Ruimao Zhang, Jiong Wang, Xiang Wan

项目主页 | 视频 |

  • SCM是弱监督目标定位的外部Transformer解决方案。
  • 轻量级:SCM是一个外部Transformer模型,不产生额外参数。
  • 性能:SCM仅使用约20%~30%的参数就超越了大多数竞争性框架(CNN和Transformer)。