Scholar

Johannes Ackermann

Google Scholar ID: 2HvSMI8AAAAJ

The University of Tokyo

Reinforcement LearningMachine Learning

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

244

H-index

4

i10-index

2

Publications

8

Co-authors

11

list available

Contact

Emailjohannes.ackermann@tum.de TwitterOpen ↗GitHubOpen ↗LinkedInOpen ↗

Publications

7 items

Bridging Spherical Black-Box Optimizers

2026

Cited

0

Do Coding Agents Deceive Us? Detecting and Preventing Cheating via Capped Evaluation with Randomized Tests

2026

Cited

0

Mitigating Reward Hacking in RLHF via Advantage Sign Robustness

2026

Cited

0

Gradient Regularization Prevents Reward Hacking in Reinforcement Learning from Human Feedback and Verifiable Rewards

2026

Cited

0

Off-Policy Corrected Reward Modeling for Reinforcement Learning from Human Feedback

2025

Cited

0

Recursive Reward Aggregation

2025

Cited

0

Offline Reinforcement Learning with Domain-Unlabeled Data

2024

Cited

0

Resume (English only)

Academic Achievements

Paper 'Off-Policy Corrected Reward Modeling for Reinforcement Learning from Human Feedback' accepted at COLM 2025
Two papers accepted at RLC 2025: 'Recursive Reward Aggregation' and 'Offline Reinforcement Learning with Domain-Unlabeled Data'
Paper 'Offline Reinforcement Learning from Datasets with Structured Non-Stationarity' accepted at RLC 2024
Published 'Unsupervised Task Clustering for Multi-Task Reinforcement Learning' at ECML-PKDD 2021
Contributed to multiple RL research directions including task representation, reward aggregation beyond discounted sum, and handling non-stationary datasets

Co-authors

11 total

Masashi Sugiyama

Director, RIKEN Center for Advanced Intelligence Project / Professor, The University of Tokyo

Team Director, RIKEN Center for Advanced Intelligence Project

Roger Wattenhofer

Soichiro Nishimori

The University of Tokyo

RIKEN Center for Advanced Intelligence Project

The University of Tokyo, RIKEN AIP