Scholar

Jiaxuan Gao

Google Scholar ID: UHSwL-wAAAAJ

Institute for Interdisciplinary Information Sciences, Tsinghua University

multi-agent reinforcement learninglarge language model

Google Scholar↗

Citations & Impact

All-time

Citations

2,795

H-index

i10-index

Publications

Co-authors

list available

Contact

No contact links provided.

Publications

16 items

Embodied Operators and Benchmarking: Toward Reusable and Deployable Embodied Intelligence Systems

2026

Cited

Next-Generation Agentic Reinforcement Learning Systems Enable Self-Evolving Agents

2026

Cited

Verifiable Process Rewards for Agentic Reasoning

2026

Cited

Sword: Style-Robust World Models as Simulators via Dynamic Latent Bootstrapping for VLA Policy Post-Training

2026

Cited

MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation

2026

Cited

AREAL-DTA: Dynamic Tree Attention for Efficient Reinforcement Learning of Large Language Models

2026

Cited

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

2026

Cited

Extending Test-Time Scaling: A 3D Perspective with Context, Batch, and Turn

2025

Cited

Resume (English only)

Co-authors

3 total

Yi Wu

Institute for Interdisciplinary Information Sciences, Tsinghua University

Chao Yu（于超）

Tsinghua University

Shusheng Xu

IIIS, Tsinghua University