Publications

For the up-to-date publication list, please visit the Google Scholar page.

Filter by type:

**(*) denotes equal contribution**

2026

How and What to Imagine? Visual Thinking in Unified Multimodal Models for Cross-View Spatial Reasoning

Qian Yang, Ankur Sikarwar*, Huy Le*, Le Zhang, Zhuan Shi, Perouz Taslakian, Aishwarya Agrawal

arXiv 2026

arXiv

Rethinking Progression of Memory State in Robotic Manipulation: An Object-Centric Perspective

Nhat Chung*, Taisei Hanyu*, Toan Nguyen, Huy Le, Frederick Bumgarner, Duy Minh Ho Nguyen, Khoa Vo, Kashu Yamazaki, Chase Rainwater, Tung Kieu, Anh Nguyen, Ngan Le

AAAI, 2026

arXiv Project Page Code

HuggingFace

SlotVLA: Towards Modeling of Object–Relation Representations in Robotic Manipulation

Taisei Hanyu*, Nhat Chung*, Huy Le, Toan Nguyen, Yuki Ikebe, Anthony Gunderman, Duy Minh Ho Nguyen, Khoa Vo, Tung Kieu, Kashu Yamazaki, Chase Rainwater, Anh Nguyen, Ngan Le

ICRA, 2026

arXiv Project Page Code

HuggingFace

UNO: Unifying One-stage Video Scene Graph Generation via Object-Centric Visual Representation Learning

Huy Le, Nhat Chung, Tung Kieu, Jingkang Yang, Ngan Le

WACV, 2026

arXiv Code

2025

BiMa: Towards Biases Mitigation for Text-Video Retrieval via Scene Element Guidance

Huy Le, Nhat Chung, Tung Kieu, Anh Nguyen, Ngan Le

ACM MM, 2025

arXiv Code

2024

WAVER: Writing-style Agnostic Text-Video Retrieval via Distilling Vision-Language Models through Open-Vocabulary Knowledge

Huy Le, Tung Kieu, Anh Nguyen, Ngan Le

ICASSP, 2024
Oral Presentation

arXiv Code

2023

Tracked-Vehicle Retrieval by Natural Language Descriptions With Multi-Contextual Adaptive Knowledge

Huy Le, Quang Qui-Vinh Nguyen, Duc Trung Luu, Truc Chau, Nhat Chung, Synh Ha

CVPR Workshop 2023
Track 2 - Winner Award🏆, The 7th AI City Challenge Workshop

PDF Code

Multi-camera People Tracking With Mixture of Realistic and Synthetic Knowledge

Quang Qui-Vinh Nguyen, Huy Le, Truc Chau, Duc Trung Luu, Nhat Chung, Synh Ha

CVPR Workshop 2023
Track 1 - Runner-up Award🥈, The 7th AI City Challenge Workshop

PDF Code

2022

Tracked-vehicle Retrieval by Natural Language Descriptions with Domain Adaptive Knowledge

Huy Le*, Quang Qui-Vinh Nguyen*, Vuong Nguyen, Thong Nguyen, Nhat Chung, Tin Thai, Synh Ha

CVPR Workshop 2022
The 6th AI City Challenge Workshop

PDF

Multi-Camera Multi-Vehicle Tracking with Domain Generalization and Contextual Constraints

Nhat Chung, Huy Le, Vuong Nguyen, Quang Qui-Vinh Nguyen, Thong Nguyen, Tin Thai, Synh Ha

CVPR Workshop 2022
The 6th AI City Challenge Workshop

PDF