Scholar

Cong Yao

Google Scholar ID: IpmnLFcAAAAJ

Alibaba DAMO Academy

Computer VisionVision-Language ModelsOCRDocument UnderstandingScene Text Detection and Recognition

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

15,731

H-index

44

i10-index

64

Publications

20

Co-authors

9

list available

Contact

No contact links provided.

Publications

4 items

Spectral entropy prior-guided deep feature fusion architecture for magnetic core loss

2025

Cited

0

Generative Compositor for Few-Shot Visual Information Extraction

2025

Cited

0

ProcTag: Process Tagging for Assessing the Efficacy of Document Instruction Data

arXiv.org · 2024

Cited

0

Bi-VLDoc: Bidirectional Vision-Language Modeling for Visually-Rich Document Understanding

International Journal on Document Analysis and Recognition · 2022

Cited

18

Resume (English only)

Co-authors

9 total

Huazhong University of Science and Technology (HUST)

Professor, Huazhong University of Science and Technology

Professor, Cognitive Science, Computer Science&Engineering, UC San Diego

Wei Shen (沈为)

Professor, Shanghai Jiao Tong University

Director of School of Computing & Data Science, HKU; Visiting Professor of EECS, Berkeley

PhD student, Dept. of EI, Huazhong University of Science and Technology

LONGIN JAN LATECKI

Professor of Computer Science, Temple University, Philadelphia