Scholar

Yudong Yang

Google Scholar ID: NOQDMrAAAAAJ

Tsinghua University

Multimodal LLMSpeech Processing

Google Scholar↗

Citations & Impact

All-time

Citations

38

H-index

4

i10-index

1

Publications

7

Co-authors

6

list available

Contact

No contact links provided.

Publications

14 items

SLVMBench: Skill Learning from Video Memory

2026

Cited

0

video-SALMONN-R$^3$: Learning to ReWatch, ReAsk, and ReAnswer for Efficient Video Understanding

2026

Cited

0

Learning to Attend to Depression-Related Patterns: An Adaptive Cross-Modal Gating Network for Depression Detection

2026

Cited

0

From Speech to Profile: A Protocol-Driven LLM Agent for Psychological Profile Generation

2026

Cited

0

SPX-VIX Risk Computations Via Perturbed Optimal Transport

2026

Cited

0

Speech-Audio Compositional Attacks on Multimodal LLMs and Their Mitigation with SALMONN-Guard

2025

Cited

0

video-SALMONN S: Streaming Audio-Visual LLMs Beyond Length Limits via Memory

2025

Cited

0

UTI-LLM: A Personalized Articulatory-Speech Therapy Assistance System Based on Multimodal Large Language Model

2025

Cited

0

Resume (English only)

Co-authors

6 total

University of Cambridge

Tsinghua University

Department of Electronic Engineering, Tsinghua University

Tsinghua University

The Chinese University of Hong Kong

Tsinghua University