Scholar

Shilong Liu

Google Scholar ID: nkSVY3MAAAAJ

RS@ByteDance, PhD@THU

Computer VisionObject DetectionVisual GroundingMulti-ModalityMultimodal Agent

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

12,342

H-index

30

i10-index

44

Publications

20

Co-authors

40

list available

Contact

No contact links provided.

Publications

31 items

EEVEE: Towards Test-time Prompt Learning in the Real World for Self-Improving Agents

2026

Cited

0

Any2Poster: Any-Source Poster Generation Across Modalities and Domains

2026

Cited

0

LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding

2026

Cited

0

MemEye: A Visual-Centric Evaluation Framework for Multimodal Agent Memory

2026

Cited

0

Learning Agent Routing From Early Experience

2026

Cited

0

Wan-R1: Verifiable-Reinforcement Learning for Video Reasoning

2026

Cited

0

UI-Mem: Self-Evolving Experience Memory for Online Reinforcement Learning in Mobile GUI Agents

2026

Cited

0

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

2026

Cited

0

Resume (English only)

Co-authors

40 total

International Digital Economy Academy (IDEA)

PhD student, Hong Kong University of Science and Technology

NVIDIA Research

PhD student of Electrical and Electronic Engineering, The University of Hong Kong

Professor of Computer Science, Tsinghua University

Associated Professor, Tsinghua University

International Digital Economy Academy

Research Scientist, Meta SuperIntelligence Lab