AI Applied Scientist - PhD Intern, Evaluation Systems and Metrics

About the job

We are seeking remote PhD interns for Summer 2026! As an intern, you will help develop cutting-edge evaluation methodologies for AI systems. Your research will focus on creating robust, scalable metrics and frameworks to assess the quality, consistency, and performance of generative models across multiple modalities.

Responsibilities

Novel Evaluation Metrics: Develop innovative assessment methodologies for emerging AI capabilities, focusing on consistency and quality across complex multi-modal outputs

Self-Improving Assessment: Design evaluation systems that learn and adapt from feedback, automatically discovering new evaluation criteria and improving assessment quality over time

Privacy-Preserving Evaluation: Design frameworks that incorporate domain-specific implementations of differential privacy to protect sensitive user information while maintaining utility for model training and assessment.

Ethical Fair Housing Evaluation: Develop scalable methodologies for assessing agentic systems, ensuring compliance with fair housing standards and promoting ethical, responsible AI deployment

Qualifications

Minimum

Currently enrolled as a PhD student in computer science, machine learning, computer vision, or a related field, with strong publication record

Preferred

A record of publication in conferences, workshops, or journals is a plus