Scholar

De-An Huang

Google Scholar ID: HEY3UzgAAAAJ

Stanford University

Computer VisionRoboticsMachine LearningBioinformatics

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

7,638

H-index

37

i10-index

49

Publications

20

Co-authors

152

list available

Contact

No contact links provided.

Publications

11 items

VideoITG: Multimodal Video Understanding with Instructed Temporal Grounding

2025

Cited

0

Argus: Vision-Centric Reasoning with Grounded Chain-of-Thought

2025

Cited

0

FRAG: Frame Selection Augmented Generation for Long Video and Long Document Understanding

2025

Cited

0

Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models

2025

Cited

0

Token-Efficient Long Video Understanding for Multimodal LLMs

2025

Cited

0

QLIP: Text-Aligned Visual Tokenization Unifies Auto-Regressive Multimodal Understanding and Generation

2025

Cited

0

Eagle 2: Building Post-Training Data Strategies from Scratch for Frontier Vision-Language Models

2025

Cited

0

Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks

2025

Cited

0

Resume (English only)

Co-authors

152 total

Anima Anandkumar

California Institute of Technology and NVIDIA

Professor of Computer Science, Stanford University

Principal Research Scientist & Research Lead, NVIDIA Research

Juan Carlos Niebles

Research Director (Salesforce) & Adjunct Professor (Stanford University)

The University of Texas at Austin, NVIDIA Research

NVIDIA Research

Linxi "Jim" Fan

NVIDIA, https://jimfan.me

University of Wisconsin - Madison/NVIDIA