Scholar

Hanrong Ye

Google Scholar ID: 1XbRknQAAAAJ

NVIDIA Research

multi-task multi-modal models

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

569

H-index

12

i10-index

13

Publications

20

Co-authors

0

Contact

No contact links provided.

Publications

19 items

Nemotron-Labs-Diffusion-Image: Advancing Masked Discrete Diffusion for High-Resolution Image Synthesis

2026

Cited

0

Vesta: A Generalist Embodied Reasoning Model

2026

Cited

0

Scaling Parallel Sequence Models to Foundation-Scale Vision Encoders

2026

Cited

0

JetViT: Efficient High-Resolution Vision Transformer with Post-Training Attention Search

2026

Cited

0

Nemotron 3 Nano Omni: Efficient and Open Multimodal Intelligence

2026

Cited

0

Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive Gazing

2026

Cited

0

Speech-Hands: A Self-Reflection Voice Agentic Approach to Speech Recognition and Audio Reasoning with Omni Perception

2026

Cited

0

GSPN-2: Efficient Parallel Sequence Modeling

2025

Cited

0

Resume (English only)

Co-authors

0 total

Co-authors: 0 (list not available)