Scholar

Alexander Wettig

Google Scholar ID: N_jSE08AAAAJ

Princeton University

Natural Language Processing

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

2,471

H-index

i10-index

Publications

Co-authors

list available

Contact

TwitterOpen ↗GitHubOpen ↗

Publications

11 items

Composer 2 Technical Report

2026

Cited

Extracting Rule-based Descriptions of Attention Features in Transformers

2025

Cited

Cache Me If You Can: How Many KVs Do You Need for Effective Long-Context LMs?

2025

Cited

SWE-smith: Scaling Data for Software Engineering Agents

2025

Cited

Lugha-Llama: Adapting Large Language Models for African Languages

2025

Cited

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

2025

Cited

Metadata Conditioning Accelerates Language Model Pre-training

2025

Cited

Establishing Task Scaling Laws via Compute-Efficient Model Ladders

arXiv.org · 2024

Cited

Resume (English only)

Academic Achievements

Published multiple papers in top conferences such as ICML, ACL, NeurIPS, ICLR. Examples include: 'SWE-smith: Scaling Data for Software Engineering Agent', 'Organize the Web: Constructing Domains Enhances Pre-Training Data Curation', 'Metadata Conditioning Accelerates Language Model Pre-training', etc.

Research Experience

Interned at Ai2 during PhD. Currently working on training coding agents at Cursor.

Education

PhD in Computer Science at Princeton University, advised by Danqi Chen; Undergraduate at the University of Cambridge, advised by Adrian Weller.

Background

Research interests: building and understanding large language models, with a particular focus on their training data. Worked on projects like QuRating, WebOrganizer, ProLong, Masking Rates. Also studied why LMs are easy to adapt (via Kernel Behavior) and how to interpret their internal workings (Transformer Programs, Edge Pruning). Part of the team that built SWE-bench and SWE-agent.

Miscellany