Scholar

Wenyi Hong

Google Scholar ID: JSEzrlwAAAAJ

Tsinghua University

multimodal pretraining

Homepage↗Google Scholar↗

Citations & Impact

All-time

Citations

4,964

H-index

13

i10-index

14

Publications

16

Co-authors

6

list available

Contact

No contact links provided.

Publications

13 items

Video2Code: Generating Interactive Webpages from UI Videos via Action-Aware Revisit

2026

Cited

0

GLM-5V-Turbo: Toward a Native Foundation Model for Multimodal Agents

2026

Cited

0

Vision2Web: A Hierarchical Benchmark for Visual Website Development with Agent Verification

2026

Cited

0

GLM-OCR Technical Report

2026

Cited

0

UI2Code^N: A Visual Language Model for Test-Time Scalable Interactive UI-to-Code Generation

2025

Cited

0

WebVIA: A Web-based Vision-Language Agentic Framework for Interactive and Verifiable UI-to-Code Generation

2025

Cited

0

Glyph: Scaling Context Windows via Visual-Text Compression

2025

Cited

0

GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

2025

Cited

0

Resume (English only)

Co-authors

6 total

Tsinghua University, Bytedance Seed

WeBank Chair Professor, Tsinghua University

CS, Tsinghua University

PHD Student, Tsinghua University

Tsinghua University

Tsinghua University