Scholar

Xiaotian Han

Google Scholar ID: 5fHHi24AAAAJ

Research Scientist, OpenAI

Machine learningComputer VisionMultimodalGenAILLM

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

485

H-index

i10-index

Publications

Co-authors

list available

Contact

Emailhxt872675353@gmail.com CVOpen ↗TwitterOpen ↗GitHubOpen ↗LinkedInOpen ↗

Publications

27 items

WRIT: Write-Read Intensive Trajectory Synthesis for Multi-Turn User-Facing Agents

2026

Cited

Path-Lock Expert: Separating Reasoning Mode in Hybrid Thinking via Architecture-Level Separation

2026

Cited

Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models

2026

Cited

ACE-Bench: Agent Configurable Evaluation with Scalable Horizons and Controllable Difficulty under Lightweight Environments

2026

Cited

Rethinking Exploration in RLVR: From Entropy Regularization to Refinement via Bidirectional Entropy Modulation

2026

Cited

ERNIE 5.0 Technical Report

2026

Cited

When Domains Interact: Asymmetric and Order-Sensitive Cross-Domain Effects in Reinforcement Learning for Reasoning

2026

Cited

Mid-Think: Training-Free Intermediate-Budget Reasoning via Token-Level Triggers

arXiv.org · 2026

Cited

Resume (English only)

Academic Achievements

In 2024, two papers were accepted by NeurIPS 2024: 'DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation' and 'Visual Anchors Are Strong Information Aggregators For Multimodal Large Language Model'. Another paper 'InfiMM-WebMath-40B: Advancing Multimodal Pre-Training for Enhanced Mathematical Reasoning' was accepted by the 4th MATH-AI Workshop at NeurIPS 24. Additionally, a paper 'COCO is “ALL’’ You Need for Visual Instruction Fine-tuning' was accepted by ICME 2024.

Research Experience

Senior Research Scientist at ByteDance Seed; Senior Applied Scientist at Microsoft Azure AI Computer Vision Team.

Education

M.S. from Duke University; B.S. from University of Science and Technology of China (USTC).

Background

Currently a Researcher at OpenAI, focusing on multimodal. Formerly a Senior Research Scientist at ByteDance Seed and a Senior Applied Scientist at Microsoft Azure AI Computer Vision Team. Research interests include computer vision, multimodal, reinforcement learning, and deep learning.

Co-authors

20 total