Scholar

Wenxuan Song

Google Scholar ID: jtFoCpwAAAAJ

The Hong Kong University of Science and Technology (Guangzhou)

Vision-language-action ModelRobotics

Google Scholar↗

Citations & Impact

All-time

Citations

144

H-index

7

i10-index

6

Publications

12

Co-authors

9

list available

Contact

No contact links provided.

Publications

33 items

PIVOTSBench: Evaluating Fine-Grained Interpersonal Relationship Reasoning in Multimodal Large Language Models

2026

Cited

0

Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation

2026

Cited

0

IPIBench: Evaluating Interactive Proactive Intelligence of MLLMs under Continuous Streams

2026

Cited

0

SEDualVLN: A Spatially-Enhanced Dual-System for Vision-Language Navigation

2026

Cited

0

CapVector: Learning Transferable Capability Vectors in Parametric Space for Vision-Language-Action Models

2026

Cited

0

RoboMemArena: A Comprehensive and Challenging Robotic Memory Benchmark

2026

Cited

0

DFM-VLA: Iterative Action Refinement for Robot Manipulation via Discrete Flow Matching

2026

Cited

0

Fast-dVLA: Accelerating Discrete Diffusion VLA to Real-Time Performance

2026

Cited

0

Resume (English only)

Co-authors

9 total

Zhejiang University

Zhejiang University | Westlake University

Westlake University

Alibaba DAMO Academy | ZJU | Westlake University

Shanghai Jiao Tong University

Zongyuan (Tony) Ge

Associate Prof | Director of AIM for Health Lab | NVIDIA AI Fellowship

Assistant Professor, Hong Kong University of Science and Technology (Guangzhou)

Tongji University