Scholar

Kaiwen Zhu

Google Scholar ID: O8lP5XMAAAAJ

Shanghai Jiao Tong University

Multi-Modal GenerationComputer Vision

Google Scholar↗

Citations & Impact

All-time

Citations

55

H-index

3

i10-index

2

Publications

6

Co-authors

7

list available

Contact

No contact links provided.

Publications

11 items

StableI2I: Spotting Unintended Changes in Image-to-Image Transition

2026

Cited

0

Accelerating Masked Image Generation by Learning Latent Controlled Dynamics

2026

Cited

0

UniPercept: Towards Unified Perceptual-Level Image Understanding across Aesthetics, Quality, Structure, and Texture

2025

Cited

0

dMLLM-TTS: Self-Verified and Efficient Test-Time Scaling for Diffusion Multi-Modal Large Language Models

2025

Cited

0

PICABench: How Far Are We from Physically Realistic Image Editing?

2025

Cited

0

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

2025

Cited

0

Exploring Scalable Unified Modeling for General Low-Level Vision

2025

Cited

0

ArtiMuse: Fine-Grained Image Aesthetics Assessment with Joint Scoring and Expert-Level Understanding

2025

Cited

0

Resume (English only)

Co-authors

7 total

Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences

MMLab, The Chinese University of Hong Kong

Tenure-Track Faculty Member, INSAIT, Sofia University

Information Engineering Department, The Chinese University of Hong Kong

SJTU，Shanghai AI Laboratory

Professor of Shanghai AI Laboratory; Shenzhen Institutes of Advanced Technology, CAS

Shanghai Artificial Intelligence Laboratory