Scholar

Yong Man Ro

Google Scholar ID: IPzfF7cAAAAJ

Professor of Electrical Engineering, KAIST, ICT Endowed Chair Professor

Multimodal learningVision Language integrationImage processing and Computer vision

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

6,408

H-index

i10-index

153

Publications

Co-authors

list available

Contact

No contact links provided.

Publications

13 items

Decoding Strategies for Diffusion-Based ASR: A Systematic Evaluation of Confidence-Based Thresholding

2026

Cited

Diffusion Large Language Models for Visual Speech Recognition

2026

Cited

Robust Grounding with MLLMs against Occlusion and Small Objects via Language-guided Semantic Cues

2026

Cited

STRIDE: When to Speak Meets Sequence Denoising for Streaming Video Understanding

2026

Cited

Recursive Think-Answer Process for LLMs and VLMs

2026

Cited

GCAgent: Long-Video Understanding via Schematic and Narrative Episodic Memory

2025

Cited

Emotion-Coherent Reasoning for Multimodal LLMs via Emotional Rationale Verifier

2025

Cited

Unified Reinforcement and Imitation Learning for Vision-Language Models

2025

Cited

Resume (English only)

Co-authors

31 total

Co-author 1

Konstantinos N Plataniotis

Professor, ECE Department, University of Toronto

Hak Gu Kim

Assistant Professor of GSAIM, Chung-Ang University

Wesley De Neve

Associate Professor at Ghent University (Belgium) & Ghent University Global Campus (Korea)

Truong, Cong Thang

The University of Aizu

Assistant Professor of Computer Science, Kyung Hee University