Scholar

Hanan Gani

Google Scholar ID: XFugeQ4AAAAJ

University of California San Diego; Mohamed Bin Zayed University of Artificial Intelligence

Computer VisionMulti-modal learningGenerative modelsEmbodied AI

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

325

H-index

i10-index

Publications

Co-authors

list available

Contact

No contact links provided.

Publications

6 items

RoboTALES: Learning Reasoning-Guided Robot Policies via Task-Aligned Simulated Futures

2026

Cited

Recovering Cloud Microstructures with Cascaded Diffusion Inversion

2026

Cited

VideoMolmo: Spatio-Temporal Grounding Meets Pointing

2025

Cited

Aurelia: Test-time Reasoning Distillation in Audio-Visual LLMs

2025

Cited

VideoGLaMM: A Large Multimodal Model for Pixel-Level Visual Grounding in Videos

arXiv.org · 2024

Cited

VANE-Bench: Video Anomaly Evaluation Benchmark for Conversational LMMs

arXiv.org · 2024

Cited

Resume (English only)

Co-authors

11 total

Salman Khan

MBZUAI, Australian National University

Muzammal Naseer

Asst. Professor, Khalifa University

Fahad Shahbaz Khan

MBZUAI, Linköping University Sweden

Mohammad Yaqub

Researcher in Biomedical Engineering, Associate professor at MBZUAI

Muhammad Uzair Khattak

EPFL

Shariq Farooq Bhat

King Abdullah University of Science and Technology

Peter Wonka

King Abdullah University of Science and Technology (KAUST)

Abrar Majeedi

University of Wisconsin-Madison