Scholar

Chengjian Feng

Google Scholar ID: jc3YlxEAAAAJ

Meituan

Computer VisionObject Detection

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

2,051

H-index

i10-index

Publications

Co-authors

list available

Contact

Emailfcjian@outlook.com GitHubOpen ↗

Publications

11 items

LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories

2026

Cited

Seedance 1.5 pro: A Native Audio-Visual Joint Generation Foundation Model

2025

Cited

RoboTron-Sim: Improving Real-World Driving via Simulated Hard-Case

2025

Cited

X-SAM: From Segment Anything to Any Segmentation

2025

Cited

DisTime: Distribution-based Time Representation for Video Large Language Models

2025

Cited

AP-CAP: Advancing High-Quality Data Synthesis for Animal Pose Estimation via a Controllable Image Generation Pipeline

2025

Cited

DataPlatter: Boosting Robotic Manipulation Generalization with Minimal Costly Data

2025

Cited

P3Nav: A Unified Framework for Embodied Navigation Integrating Perception, Planning, and Prediction

2025

Cited

Resume (English only)

Academic Achievements

TOOD: Task-aligned One-stage Object Detection (ICCV 2021, Oral)
Exploring Classification Equilibrium in Long-Tailed Object Detection (ICCV 2021)
PromptDet: Towards Open-vocabulary Detection using Uncurated Images (ECCV 2022)
AeDet: Azimuth-invariant Multi-view 3D Object Detection (CVPR 2023)
InstaGen: Enhancing Object Detection by Training on Synthetic Dataset (CVPR 2024)
InstructVEdit: A Holistic Approach for Instructional Video Editing (Preprint, 2025)
P3Nav: A Unified Framework for Embodied Navigation Integrating Perception, Planning, and Prediction (Preprint, 2025)
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving (Preprint, 2024)
RoboMM: All-in-One Multimodal Large Model for Robotic Manipulation (Preprint, 2024)

Research Experience

Researcher at Meituan Inc.

Background

Currently a researcher at Meituan Inc. Primary research interests encompass a broad range of topics, including large multimodal models, diffusion models, autonomous driving, embodied AI, object detection, domain adaptation, and more. Specifically, particularly interested in the application of large multimodal models and diffusion models to improve daily lives.

Co-authors

7 total