10/02/2026
🎉 Chúc mừng thầy Cao Xuân Nam đã bảo vệ thành công Luận án Tiến sĩ cấp Cơ sở đào tạo
Luận án được thực hiện với đề tài “Phát sinh video gương mặt người nói từ thông tin tiếng nói” (Speech-driven Talking Face Video Generation)" và nhận được sự hướng dẫn khoa học của PGS.TS Trần Minh Triết và PGS.TS Vũ Hải Quân.
🔍 Hướng tiếp cận nghiên cứu
Luận án tập trung giải quyết bài toán phát sinh gương mặt người nói theo hướng gián tiếp, trong đó quá trình tái tạo khuôn mặt được thực hiện thông qua bước trung gian là dự đoán các điểm landmark từ tín hiệu âm thanh tiếng nói.
Việc sử dụng landmark đóng vai trò quan trọng trong việc đảm bảo sự nhất quán giữa các bộ phận trên khuôn mặt, duy trì sự đồng bộ giữa chuyển động môi và nội dung âm thanh trước khi tổng hợp hình ảnh hoàn chỉnh. Đồng thời, hướng tiếp cận này cũng giúp mô hình tăng khả năng tổng quát hóa và thích ứng tốt hơn với các biến đổi trong dữ liệu đầu vào.
Luận án đã đóng góp nhiều kết quả mới và có giá trị trong bài toán phát sinh khuôn mặt người nói từ âm thanh, nổi bật như:
✅ Bổ sung đặc trưng LLFs bên cạnh MFCC và Mel-spectrogram, giúp tăng độ chính xác dự đoán landmark trung bình khoảng 5–7% so với mô hình không sử dụng LLFs.
✅ Làm rõ vai trò của landmark từ các khung hình trước trong việc cải thiện độ ổn định theo thời gian.
✅ Khẳng định hiệu quả của KLD loss trong việc căn chỉnh đặc trưng âm thanh và landmark trong cùng không gian tiềm ẩn, góp phần nâng cao hiệu suất mô hình.
✅ Đề xuất phương pháp tổng hợp khuôn mặt theo quy trình hai giai đoạn (từ vùng miệng đến toàn bộ khuôn mặt), giúp giảm sai số và cải thiện chất lượng ảnh theo các độ đo PSNR, SSIM, FID và LPIPS.
✅ Chứng minh tính hiệu quả và khả năng tổng quát hóa của mô hình trên các bộ dữ liệu MEAD, CREMA-D và dữ liệu thực tế.
📌 Công bố khoa học là điểm nhấn quan trọng của luận án khi các nội dung nghiên cứu đã được công bố với 06 bài báo khoa học, bao gồm:
🌟 02 bài trên tạp chí quốc tế Q1
🌟 02 bài báo hội thảo xếp hạng B
🌟 02 bài báo hội thảo xếp hạng C
🚀 Tiềm năng ứng dụng
Kết quả nghiên cứu mở ra nhiều hướng ứng dụng quan trọng trong trợ lý ảo, giao tiếp từ xa, giải trí số, phục hồi dữ liệu lịch sử, hỗ trợ người khiếm thị, pháp y, y tế và giáo dục. Đồng thời, đây cũng là nền tảng cho các nghiên cứu tiếp theo về nâng cao chất lượng hình ảnh, xử lý dữ liệu nhiễu, mở rộng đa ngôn ngữ và kiểm soát cảm xúc cho khuôn mặt ảo.
🌟 Một lần nữa, Khoa Công nghệ thông tin xin chúc mừng thầy Cao Xuân Nam với cột mốc học thuật ý nghĩa này.
Kính chúc thầy tiếp tục gặt hái nhiều thành công trong giảng dạy, nghiên cứu và truyền cảm hứng cho các thế hệ sinh viên.
26/01/2026
20/01/2026
10/01/2026
09/01/2026
08/01/2026
30/12/2025
27/12/2025
26/12/2025
26/12/2025
24/12/2025