Scholar

Yuhang Cao

Google Scholar ID: sJkqsqkAAAAJ

MMLab The Chinese University of Hong Kong

Multi-Modal Large Language ModelObject DetectionFew Shot Object Detection

Google Scholar↗

Citations & Impact

All-time

Citations

7,058

H-index

19

i10-index

27

Publications

20

Co-authors

0

Contact

No contact links provided.

Publications

35 items

JoyAI-VL-Interaction: Real-Time Vision-Language Interaction Intelligence

2026

Cited

0

CapRL++: Unified Reinforcement Learning with Verifiable Rewards for Dense Image and Video Captioning

2026

Cited

0

Visual Self-Refine: A Pixel-Guided Paradigm for Accurate Chart Parsing

2026

Cited

0

Demo-ICL: In-Context Learning for Procedural Video Knowledge Acquisition

2026

Cited

0

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

2025

Cited

0

Think Visually, Reason Textually: Vision-Language Synergy in ARC

2025

Cited

0

Spatial-SSRL: Enhancing Spatial Understanding via Self-Supervised Reinforcement Learning

2025

Cited

0

STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 4D Intelligence

2025

Cited

0

Resume (English only)

Co-authors

0 total

Co-authors: 0 (list not available)