Scholar

Mubashara Akhtar

Google Scholar ID: x8K6TisAAAAJ

ETH AI Center fellow at ETH Zurich

NLPMultimodalityBenchmarking & Evaluation

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

433

H-index

11

i10-index

11

Publications

20

Co-authors

10

list available

Contact

No contact links provided.

Publications

10 items

Benchmarking and Enhancing Text-to-Image Models for Generating Visual Representations in Early Arithmetic Education

2026

Cited

0

When AI Benchmarks Plateau: A Systematic Study of Benchmark Saturation

2026

Cited

0

Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads

2025

Cited

0

Who Evaluates AI's Social Impacts? Mapping Coverage and Gaps in First and Third Party Evaluations

2025

Cited

0

Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning

2025

Cited

0

Chimera: Diagnosing Shortcut Learning in Visual-Language Understanding

2025

Cited

0

LEXam: Benchmarking Legal Reasoning on 340 Law Exams

2025

Cited

0

AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons

arXiv.org · 2025

Cited

0

Resume (English only)

Co-authors

10 total

Senior Lecturer, King's College London

Director, King's Institute for AI & Director of research, Open Data Institute, United Kingdom

Andreas Vlachos

Professor, University of Cambridge

Assistant Professor of Computer Science, Arizona State University

HKUST (GZ) | HKUST

Omar Benjelloun

Research Software Engineer, Google DeepMind

Julian Martin Eisenschlos

NLP Researcher, Google DeepMind