Scholar

Dave Zhenyu Chen

Google Scholar ID: hon4EsIAAAAJ

Research Scientist, Huawei Noah's Ark Lab

3D Computer VisionGenerative ModelsNovel View SynthesisMultimodal Learning

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

1,340

H-index

i10-index

Publications

Co-authors

list available

Contact

Emailzhenyu.chen@tum.de CVOpen ↗TwitterOpen ↗GitHubOpen ↗LinkedInOpen ↗

Publications

12 items

AsySplat: Efficient Asymmetric 3D Gaussian Splatting for Long-Sequence Scene Modeling

2026

Cited

OneCanvas: 3D Scene Understanding via Panoramic Reprojection

2026

Cited

AnchorSplat: Feed-Forward 3D Gaussian SplattingWith 3D Geometric Priors

2026

Cited

Reliev3R: Relieving Feed-forward Reconstruction from Multi-View Geometric Annotations

2026

Cited

GAP-MLLM: Geometry-Aligned Pre-training for Activating 3D Spatial Perception in Multimodal Large Language Models

2026

Cited

VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection

2026

Cited

Map2Thought: Explicit 3D Spatial Reasoning via Metric Cognitive Maps

2026

Cited

WPT: World-to-Policy Transfer via Online World Model Distillation

2025

Cited

Resume (English only)

Academic Achievements

SceneTex: High-Quality Texture Synthesis for Indoor Scenes via Diffusion Priors (CVPR, 2024)
Text2Tex: Text-driven Texture Synthesis via Diffusion Models (ICCV, 2023)
UniT3D: A Unified Transformer for 3D Dense Captioning and Visual Grounding (ICCV, 2023)
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding (ECCV, 2022)
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans (CVPR, 2021)
ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language (ECCV, 2020)

Research Experience

Has been conducting full-time research at Prof. Matthias Nießner’s Visual Computing Group at the Technical University of Munich for the past 4 years. Also has a close research collaboration with Prof. Angel Chang at Simon Fraser University, Canada.

Education

Currently a PhD candidate at the TUM Visual Computing Group. Advisor is Prof. Matthias Nießner. Prior to the PhD, received a Master's Degree in Informatics from Ludwig Maximilians University of Munich (LMU).

Background

Research interests lie at the intersection of Deep Learning, 3D Computer Vision, and Natural Language Processing. Specifically, 3D scene understanding; grounding natural language in 3D environments; text-to-3D synthesis.

Co-authors

9 total