📝 学术论文
Arxiv

High-Fidelity Mask-free Neural Surface Reconstruction for Virtual Reality
Haotian Bai, Yize Chen, Lin Wang
- 一种新颖的基于渲染的神经隐式表面重建框架,旨在无需多视角物体掩码的情况下恢复紧凑且精确的表面。
- 由于图像中的重叠区域隐式地标识了用户想要捕获的表面,Hi-NeuS利用多视角渲染权重以自监督方式指导神经表面的有符号距离函数。
Arxiv

CompoNeRF: Text-guided Multi-object Compositional NeRF with Editable 3D Scene Layout
Haotian Bai, Yuanhuiyi Lyu, Lutao Jiang, Sijia Li, Haonan Lu, Xiaodong Lin, Lin Wang
- 一种新颖的框架,通过整合文本描述与基于框的空间布局来合成连贯的多物体场景。
- CompoNeRF专为精度和适应性而设计,允许用唯一提示颜色表示的单独NeRF进行组合、分解和重组,从而在分解后从缓存模型简化复杂场景的构建。
ICCV 2023

Dynamic PlenOctree for Adaptive Sampling Refinement in Explicit NeRF
Haotian Bai, Yiqi Lin, Yize Chen, Lin Wang
- 一种更紧凑且更丰富的PlenOctree (POT) NeRF表示。
- 创新点:POT用于直接优化的固定结构是次优的,因为场景复杂度随着缓存颜色和密度的更新不断演变,需要相应地细化采样分布以捕获信号复杂度。
- 性能:DOT在NeRF-synthetic和Tanks and Temples数据集上超越POT,提升了视觉质量,参数量减少超过55.15%/68.84%,帧率提升1.7/1.9倍。
CVPR 2023

Patch-Mix Transformer for Unsupervised Domain Adaptation: A Game Perspective
Jinjing Zhu*, Haotian Bai*, Lin Wang
- 被选为CVPR (亮点)论文(前2.5%)
- 大域差距:PMTrans通过中间域以相对平滑的方式连接源域和目标域。
- 博弈论:将UDA解释为一个包含三个参与者(特征提取器、分类器和PatchMix)的最小-最大交叉熵博弈,以寻找纳什均衡。
- 性能:PMTrans在Office-Home上超越基于ViT和CNN的最优方法+3.6%,在Office-31上+1.4%,在DomainNet上+17.7%。
ECCV 2022

Weakly Supervised Object Localization via Transformer with Implicit Spatial Calibration
Haotian Bai, Ruimao Zhang, Jiong Wang, Xiang Wan
- SCM是弱监督目标定位的外部Transformer解决方案。
- 轻量级:SCM是一个外部Transformer模型,不产生额外参数。
- 性能:SCM仅使用约20%~30%的参数就超越了大多数竞争性框架(CNN和Transformer)。
NeurIPS 2022(口头报告) AMOS: A large-scale abdominal multi-organ benchmark for versatile medical image segmentation.,Yuanfeng Ji, Haotian Bai, Jie Yang, Chongjian Ge, Ye Zhu, Ruimao Zhang, Zhen Li, Lingyan Zhang, Wanling Ma, Xiang Wan, Ping Luo。