Scholar

Jiajun Chai

Google Scholar ID: yDdfap0AAAAJ

Meituan Inc.

Reinforcement LearningLLMsAgentic Learning

Google Scholar↗

Citations & Impact

All-time

Citations

209

H-index

6

i10-index

5

Publications

20

Co-authors

5

list available

Contact

No contact links provided.

Publications

29 items

TAPO: Tool-Aware Policy Optimization via Credit Transfer for Multimodal Search Agents

2026

Cited

0

VistaHop: Benchmarking Multi-hop Visual Reasoning for Visual DeepSearch

2026

Cited

0

Are Full Rollouts Necessary for On-Policy Distillation?

2026

Cited

0

Joint Training of Multi-Token Prediction in Reinforcement Learning via Optimal Coefficient Calibration

2026

Cited

0

ZipRL: Adaptive Multi-Turn Context Compression with Hindsight Response Replay

2026

Cited

0

When Self-Belief Misleads: Active Label Acquisition for Reinforcement Learning with Verifiable Rewards

2026

Cited

0

AMR-SD: Asymmetric Meta-Reflective Self-Distillation for Token-Level Credit Assignment

2026

Cited

0

Implicit Hierarchical GRPO: Decoupling Tool Invocation from Execution for Tool-Integrated Mathematical Reasoning

2026

Cited

0

Resume (English only)

Co-authors

5 total

Institute of Automation, Chinese Academy of Sciences

Institute of Automation, Chinese Academy of Sciences

Institute of Automation，Chinese Academy of Sciences

Meituan, University of Science and Technology of China

Mingrui Yu (于铭瑞)

PhD student, Department of Automation, Tsinghua University