Homepage - Susan Liang

Publications

ICCV 2025

π-AVAS: Can Physics-Integrated Audio-Visual Modeling Boost Neural Acoustic Synthesis?

Susan Liang, Chao Huang, Yunlong Tang, Zeliang Zhang, Chenliang Xu.

International Conference on Computer Vision, Oct. 2025.

ICML 2025

BinauralFlow: A Causal and Streamable Approach for High-Quality Binaural Speech Synthesis with Flow Matching Models

Susan Liang, Dejan Markovic, Israel D. Gebru, Steven Krenn, Todd Keebler, Jacob Sandakly, Frank Yu, Samuel Hassel, Chenliang Xu, Alexander Richard.

Forty-second International Conference on Machine Learning, Jul. 2025.

[Paper] [Website]

CVPR 2025

VIDCOMPOSITION: Can MLLMs Analyze Compositions in Compiled Videos?

Yunlong Tang, Junjia Guo, Hang Hua, Susan Liang, Mingqian Feng, Xinyang Li, Rui Mao, Chao Huang, Jing Bi, Zeliang Zhang, Pooyan Fazli, Chenliang Xu.

The IEEE/CVF Conference on Computer Vision and Pattern Recognition, Jun. 2025.

[Paper] [Website] [Code]

ICLR 2025

Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives

Zeliang Zhang*, Susan Liang*, Daiki Shimada, Chenliang Xu. (* indicates equal contribution)

The Thirteenth International Conference on Learning Representations, Apr. 2025.

[Paper]

Generative AI for Cel-Animation: A Survey

Yunlong Tang, Junjia Guo, Pinxin Liu, Zhiyuan Wang, Hang Hua, Jia-Xing Zhong, Yunzhong Xiao, Chao Huang, Luchuan Song, Susan Liang, and Yizhi Song, Liu He, Jing Bi, Mingqian Feng, Xinyang Li, Zeliang Zhang, Chenliang Xu.

arXiv preprint.

[Paper] [Website]

Will the Inclusion of Generated Data Amplify Bias Across Generations in Future Image Classification Models?

Zeliang Zhang, Xin Liang, Mingqian Feng, Susan Liang, Chenliang Xu.

arXiv preprint.

[Paper]

Scaling Concept with Text-Guided Diffusion Models

Chao Huang, Susan Liang, Yunlong Tang, Yapeng Tian, Anurag Kumar, Chenliang Xu.

arXiv preprint.

[Paper] [Website] [Code]

ACCV 2024 🏆 Best Paper Honorable Mention

High-Quality Visually-Guided Sound Separation from Diverse Categories

Chao Huang, Susan Liang, Yapeng Tian, Anurag Kumar, Chenliang Xu.

17th Asian Conference on Computer Vision, Dec. 2024.

[Paper] [Website]

ACCV 2024

Language-Guided Joint Audio-Visual Editing Via One-Shot Adaptation

Susan Liang, Chao Huang, Yapeng Tian, Anurag Kumar, Chenliang Xu.

17th Asian Conference on Computer Vision, Dec. 2024.

[Paper] [Website] [Dataset]

CVPR 2024

Learning to Transform Dynamically for Better Adversarial Transferability

Rongyi Zhu*, Zeliang Zhang*, Susan Liang, Zhuo Liu, Chenliang Xu. (* indicates equal contribution)

Conference on Computer Vision and Pattern Recognition, Jun. 2024.

[Paper]

EACL 2024

Random Smooth-based Certified Defense against Text Adversarial Attack

Zeliang Zhang, Wei Yao, Susan Liang, Chenliang Xu.

Conference of the European Chapter of the Association for Computational Linguistics, Mar. 2024.

[Paper]

TCSVT 🔥🔥🔥 HOT

Video Understanding with Large Language Models: A Survey

Yunlong Tang*, Jing Bi*, Siting Xu*, Luchuan Song*, Susan Liang, Teng Wang, Daoan Zhang, Jie An, Jingyang Lin, Rongyi Zhu, Ali Vosoughi, Chao Huang, Zeliang Zhang, Feng Zheng, Jianguo Zhang, Ping Luo, Jiebo Luo, Chenliang Xu. (* indicates equal contribution)

IEEE Transactions on Circuits and Systems for Video Technology.

[Paper] [Website]