Scholar

Ganlin Yang

Google Scholar ID: 321C4TQAAAAJ

University of Science and Technology of China && Shanghai AI Laboratory

Computer vision3D visionMultimodal models

Google Scholar↗

Citations & Impact

All-time

Citations

17

H-index

3

i10-index

0

Publications

7

Co-authors

6

list available

Contact

No contact links provided.

Publications

8 items

Cortex: A Bidirectionally Aligned Embodied Agent Framework for Long-horizon Manipulation

2026

Cited

0

EventVLA: Event-Driven Visual Evidence Memory for Long-Horizon Vision-Language-Action Policies

2026

Cited

0

ScaleEdit-12M: Scaling Open-Source Image Editing Data Generation via Multi-Agent Framework

2026

Cited

0

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

2026

Cited

0

ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

2026

Cited

0

Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

2025

Cited

0

InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

2025

Cited

0

Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces

2025

Cited

0

Resume (English only)

Co-authors

6 total

University of Science and Technology of China

Zhizheng Zhang (张直政)

Co-founder & VP of Large Models at Galbot << Microsoft Research

Guoqiang Wei (魏国强)

Microsoft Research Asia