Scholar

Huanyu Zhang

Google Scholar ID: mtI1oVQAAAAJ

Institute of Automation, Chinese Academy of Sciences

Multimodal ReasoningMLLMTime Series Analysis

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

211

H-index

6

i10-index

4

Publications

9

Co-authors

14

list available

Contact

No contact links provided.

Publications

18 items

Minimizing Quantized Semantic Age of Information (QSAoI) in Foundation Model-Based Semantic Communications

2026

Cited

0

Efficient DP-SGD for LLMs with Randomized Clipping

2026

Cited

0

PEARL: Personalized Streaming Video Understanding Model

2026

Cited

0

CoCo: Code as CoT for Text-to-Image Preview and Rare Concept Generation

2026

Cited

0

GEBench: Benchmarking Image Generation Models as GUI Environments

2026

Cited

0

How Well Do Models Follow Visual Instructions? VIBE: A Systematic Benchmark for Visual Instruction-Driven Image Editing

2026

Cited

2

Thinking in Frames: How Visual Context and Test-Time Scaling Empower Video Reasoning

2026

Cited

2

Latent Sketchpad: Sketching Visual Thoughts to Elicit Multimodal Reasoning in MLLMs

2025

Cited

0

Resume (English only)

Co-authors

14 total

Institute of Automation, Chinese Academy of Sciences

Institute of Automation, Chinese Academy of Sciences

Institute of Automation, Chinese Academy of Sciences

Nanjing University

Institute of Automation, Chinese Academy of Sciences

University of Cambridge

Senior Research SDE, Microsoft Research Asia

Distinguished Scientist, Microsoft Research