Scholar

Songjun Tu

Google Scholar ID: _5Ir0soAAAAJ

Institute of Automation, Chinese Academy of Sciences; Pengcheng Laboratory

Large Language ModelsReinforecement Learning

Google Scholar↗

Citations & Impact

All-time

Citations

56

H-index

5

i10-index

2

Publications

11

Co-authors

2

list available

Contact

No contact links provided.

Publications

14 items

UCOB: Learning to Utilize and Evolve Agentic Skills via Credit-Aware On-Policy Bidirectional Self-Distillation

2026

Cited

0

Are Full Rollouts Necessary for On-Policy Distillation?

2026

Cited

0

One LR Doesn't Fit All: Heavy-Tail Guided Layerwise Learning Rates for LLMs

2026

Cited

0

STRIDE: A Self-Reflective Agent Framework for Reliable Automatic Equation Discovery

2026

Cited

0

AutoSearch: Adaptive Search Depth for Efficient Agentic RAG via Reinforcement Learning

2026

Cited

0

$π$-Play: Multi-Agent Self-Play via Privileged Self-Distillation without External Data

2026

Cited

0

Saliency-Guided Representation with Consistency Policy Learning for Visual Unsupervised Reinforcement Learning

2026

Cited

0

Dynamic Dual-Granularity Skill Bank for Agentic RL

2026

Cited

0

Resume (English only)

Co-authors

2 total

中国科学院自动化研究所

Institute of Automation, Chinese Academy of Sciences