Scholar

Heyang Zhao

Google Scholar ID: zHQ1ap0AAAAJ

UCLA

Machine Learning

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

238

H-index

8

i10-index

7

Publications

14

Co-authors

15

list available

Contact

No contact links provided.

Publications

9 items

Fast Rates for Offline Contextual Bandits with Forward-KL Regularization under Single-Policy Concentrability

2026

Cited

0

On the Optimal Sample Complexity of Offline Multi-Armed Bandits with KL Regularization

2026

Cited

0

Near-Optimal Regret for KL-Regularized Multi-Armed Bandits

2026

Cited

0

Best-of-Majority: Minimax-Optimal Strategy for Pass@$k$ Inference Scaling

2025

Cited

0

Beyond-Expert Performance with Limited Demonstrations: Efficient Imitation Learning with Double Exploration

2025

Cited

0

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

2025

Cited

0

Nearly Optimal Sample Complexity of Offline KL-Regularized Contextual Bandits under Single-Policy Concentrability

2025

Cited

0

Sharp Analysis for KL-Regularized Contextual Bandits and RLHF

arXiv.org · 2024

Cited

1

Resume (English only)

Co-authors

15 total

Associate Professor of Computer Science, UCLA

PhD student, Department of Computer Science, UCLA

Indiana University Bloomington

Department of Computer Science, University of California, Los Angeles

Computer Science, University of Illinois Urbana-Champaign

University of Virginia