Scholar

Takashi Shibuya

Google Scholar ID: XCRO260AAAAJ

Sony

Generative AIMultimodal LearningAudio Signal Processing

Google Scholar↗

Citations & Impact

All-time

Citations

753

H-index

13

i10-index

15

Publications

20

Co-authors

3

list available

Contact

No contact links provided.

Publications

26 items

Odoriko: A Shape-Aware Multimodal Diffusion Framework for Human Motion

2026

Cited

0

Spatio-Temporal Audio Language Modeling for Dynamic Sound Sources

2026

Cited

0

Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation Models

2026

Cited

0

Schrodinger Audio-Visual Editor: Object-Level Audiovisual Removal

2025

Cited

0

AutoRefiner: Improving Autoregressive Video Diffusion Models via Reflective Refinement Over the Stochastic Sampling Path

2025

Cited

0

Coherent Audio-Visual Editing via Conditional Audio Generation Following Video Edits

2025

Cited

0

StereoSync: Spatially-Aware Stereo Audio Generation from Video

2025

Cited

0

SONA: Learning Conditional, Unconditional, and Mismatching-Aware Discriminator

2025

Cited

0

Resume (English only)

Co-authors

3 total

Distinguished Engineer, Sony

The University of Tokyo

University of Melbourne, CMU