Scholar

Chenxi Whitehouse

Google Scholar ID: MxJqtPIAAAAJ

Research Scientist at Meta

Natural Language Processing

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

599

H-index

i10-index

Publications

Co-authors

list available

Contact

Emailchenxi.whitehouse@gmail.com CVOpen ↗TwitterOpen ↗GitHubOpen ↗LinkedInOpen ↗

Publications

13 items

Reasoning over mathematical objects: on-policy reward modeling and test time aggregation

2026

Cited

Text-to-Stage: Spatial Layouts from Long-form Narratives

2026

Cited

APRES: An Agentic Paper Revision and Evaluation System

2026

Cited

When AI Benchmarks Plateau: A Systematic Study of Benchmark Saturation

2026

Cited

Macaron: Controlled, Human-Written Benchmark for Multilingual and Multicultural Reasoning via Template-Filling

2026

Cited

Rethinking Rubric Generation for Improving LLM Judge and Reward Modeling for Open-ended Tasks

2026

Cited

Training AI Co-Scientists Using Rubric Rewards

2025

Cited

Calibrating LLM Judges: Linear Probes for Fast and Reliable Uncertainty Estimation

2025

Cited

Resume (English only)

Academic Achievements

- Paper: J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning
- Paper: MENLO: From Preferences to Proficiency – Evaluating and Modeling Native-like Quality Across 47 Languages
- Papers: What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations and Segment-Level Diffusion: A Framework for Controllable Long-Form Generation with Diffusion Language Models accepted at ACL 2025
- Paper: PRobELM: Plausibility Ranking Evaluation for Language Models accepted at COLM 2024
- Paper: Low-Rank Adaptation for Multilingual Summarisation: An Empirical Study accepted in the findings of NAACL 2024

Research Experience

- Research Scientist at Meta, working closely with Jason Weston in the FAIR Alignment team on projects involving reinforcement learning, LLM-as-a-judge, and reward modeling
- Visiting researcher at the University of Cambridge, previously a postdoctoral research associate collaborating with Prof. Andreas Vlachos on factuality in NLP
- Internship at Google DeepMind, working on multilingual summarization

Education

- PhD in Knowledge-Grounded NLP from City, University of London
- Master’s degree in Electrical Engineering from the University of Erlangen-Nürnberg and University College London

Background

Research interests include large-scale reasoning models, post-training and reinforcement learning, LLM-as-a-judge, and generative reward modeling. Focusing on fundamental AI research, particularly in Large Language Models (LLMs).

Miscellany