Scholar

Ludwig Schmidt

Google Scholar ID: SWMKy70AAAAJ

Stanford University and Anthropic

Machine LearningArtificial IntelligenceOptimizationAlgorithmsStatistics

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

43,212

H-index

i10-index

Publications

Co-authors

list available

Contact

Emailludwigsc@stanford.edu CVOpen ↗

Publications

24 items

V-GRPO: Online Reinforcement Learning for Denoising Generative Models Is Easier than You Think

2026

Cited

ZEBRAARENA: A Diagnostic Simulation Environment for Studying Reasoning-Action Coupling in Tool-Augmented LLMs

2026

Cited

Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

2026

Cited

Understanding the Fine-Grained Knowledge Capabilities of Vision-Language Models

2026

Cited

Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces

2026

Cited

NitroGen: An Open Foundation Model for Generalist Gaming Agents

arXiv.org · 2026

Cited

Concept-Aware Batch Sampling Improves Language-Image Pretraining

2025

Cited

Reusing Pre-Training Data at Test Time is a Compute Multiplier

2025

Cited

Resume (English only)

Academic Achievements

DataComp-LM: In search of the next generation of training sets for language models, NeurIPS 2024
DataComp: In search of the next generation of multimodal datasets, NeurIPS 2023
LAION-5B: An open large-scale dataset for training next generation image-text models, NeurIPS 2022, Outstanding paper award
Robust fine-tuning of zero-shot models, CVPR 2022, Best paper finalist
Retiring Adult: New Datasets for Fair Machine Learning, NeurIPS 2021 & EAAMO 2021, New Horizons Award
Measuring Robustness to Natural Distribution Shifts in Image Classification, NeurIPS 2020
Do ImageNet Classifiers Generalize to ImageNet?, ICML 2019
Towards Deep Learning Models Resistant to Adversarial Attacks, ICLR 2018
Practical and Optimal LSH for Angular Distance, NIPS 2015

Research Experience

Assistant professor at Stanford in the Computer Science Department and Stanford Data Science; member of the technical staff at Anthropic and LAION.

Education

PhD thesis 'Algorithms Above the Noise Floor', 2018, MIT, George M. Sprowls Award (for best PhD theses in computer science at MIT).

Background

Assistant professor at Stanford in the Computer Science Department and Stanford Data Science. Research interests revolve around the foundations of machine learning, often with a focus on datasets, multimodality, reliable generalization, and language models.

Miscellany