Scholar

Kunhao Zheng

Google Scholar ID: zDy4jSYAAAAJ

Meta FAIR

Code GenerationReasoningReinforcement LearningLarge Language ModelTheorem Proving

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

1,188

H-index

8

i10-index

7

Publications

16

Co-authors

33

list available

Contact

No contact links provided.

Publications

10 items

Extrapolative Weight Averaging Reveals Correctness-Efficiency Frontiers in Code RL

2026

Cited

0

WybeCoder: Verified Imperative Code Generation

2026

Cited

0

CWM: An Open-Weights LLM for Research on Code Generation with World Models

2025

Cited

0

Improving Diversity in Language Models: When Temperature Fails, Change the Loss

2025

Cited

0

Optimizing Language Models for Inference Time Objectives using Reinforcement Learning

2025

Cited

0

The KoLMogorov Test: Compression by Code Generation

2025

Cited

0

Soft Policy Optimization: Online Off-Policy RL for Sequence Models

2025

Cited

0

PILAF: Optimal Human Preference Sampling for Reward Modeling

2025

Cited

0

Resume (English only)

Co-authors

33 total

Shanghai Jiao Tong University

Alibaba Group, Shanghai Jiao Tong University

Gabriel Synnaeve

Research scientist at Facebook AI Research

Qualcomm AI Research

Shanghai Jiao Tong University | VGG, University of Oxford

Facebook AI Research