DNU - AIoT Lab Khoa Công nghệ thông tin

DNU - AIoT Lab Khoa Công nghệ thông tin

Share

Thành lập năm 2024 tại Phòng 301 GĐ2 - Trường Đại học Đại Nam

Photos from DNU - AIoT Lab Khoa Công nghệ thông tin's post 16/06/2026

[SEMINAR KHOA CNTT - DNU] SEMINAR KHOA HỌC: PHÁT TRIỂN SMALL LANGUAGE MODELS THÀNH SEARCH AGENTS HIỆU QUẢ

Kính gửi các cán bộ, giảng viên và sinh viên Khoa Công nghệ thông tin, Trường Đại học Đại Nam.

Nhằm duy trì hoạt động nghiên cứu khoa học chuyên sâu và cập nhật những giải pháp kỹ thuật mới nhất trong lĩnh vực Trí tuệ nhân tạo, Khoa Công nghệ thông tin trân trọng thông báo tổ chức buổi Seminar chuyên đề vào ngày 17/06/2026. Sự kiện tuần này tập trung giải quyết một trong những bài toán phức tạp nhất của các hệ thống AI hiện hành: Hiện tượng "ảo giác" (hallucination) trong các Mô hình Ngôn ngữ Nhỏ (SLMs).

Nội dung chi tiết của buổi Seminar:

🔹 Chuyên đề: Search, Do not Guess: Teaching Small Language Models to Be Effective Search Agents
Báo cáo cung cấp các phân tích kiến trúc chuyên sâu về việc dịch chuyển cơ chế hoạt động của SLMs từ trạng thái "dự đoán" (guessing) sang trạng thái "truy xuất" (searching). Báo cáo viên sẽ trình bày phương pháp tích hợp các công cụ tìm kiếm bên ngoài và huấn luyện SLMs đóng vai trò như những tác tử (agents) độc lập.

Phương pháp này không chỉ giúp khắc phục các hạn chế về tài nguyên lưu trữ của SLMs so với các Mô hình Ngôn ngữ Lớn (LLMs), mà còn đảm bảo tính xác thực, minh bạch của dữ liệu đầu ra, phục vụ trực tiếp cho các hệ thống hỏi đáp và truy xuất thông tin doanh nghiệp.

📌 THÔNG TIN TỔ CHỨC:

Thời gian: 14h30, Thứ 4, ngày 17/06/2026

Địa điểm: Phòng Lab 301-GD2, Khoa Công nghệ thông tin, Trường Đại học Đại Nam

Diễn giả trình bày: Bạch Ngọc Lương

Buổi Seminar là cơ hội trao đổi học thuật, thảo luận về kiến trúc hệ thống AI dành cho các cán bộ giảng viên và sinh viên định hướng nghiên cứu sâu về Xử lý ngôn ngữ tự nhiên (NLP) và Trí tuệ nhân tạo tạo sinh.

Kính mời quý thầy cô và các bạn sinh viên quan tâm tham dự.

09/06/2026

[SEMINAR KHOA CNTT - DNU] SEMINAR KHOA HỌC: MÔ HÌNH HỌC MÁY LAI VÀ NỀN TẢNG DỮ LIỆU TỔNG HỢP ULTRACHAT

Kính gửi các cán bộ, giảng viên và sinh viên Khoa Công nghệ thông tin, Trường Đại học Đại Nam.

Nhằm tiếp tục triển khai các hoạt động sinh hoạt học thuật định kỳ và cập nhật các hướng nghiên cứu mới trong lĩnh vực Trí tuệ nhân tạo, Khoa Công nghệ thông tin trân trọng thông báo tổ chức buổi Seminar chuyên đề ngày 10/06/2026. Sự kiện lần này tập trung thảo luận về các mô hình dự báo hỗn hợp trong quản lý kinh tế và giải pháp tối ưu hóa dữ liệu huấn luyện cho AI tạo sinh.

Nội dung chi tiết của buổi Seminar bao gồm:

🔹 Chuyên đề 1: Nghiên cứu mô hình học máy lai trong Dự đoán chi phí dự án xây dựng
Báo cáo sẽ trình bày tổng quan về việc kết hợp các kiến trúc học máy khác nhau (Hybrid Machine Learning Models) để giải quyết bài toán dự báo chi phí. Nội dung đi sâu vào cấu trúc luồng dữ liệu, phương pháp xử lý các biến số phức tạp trong xây dựng và phân tích hiệu suất thực tế của mô hình lai so với các mô hình đơn lẻ truyền thống.

🔹 Chuyên đề 2: UltraChat: A New Era of Synthetic Data for Generative AI
Chuyên đề thứ hai đi sâu vào xu hướng xây dựng mô hình AI tạo sinh thông qua nguồn dữ liệu tổng hợp (Synthetic Data). Báo cáo viên sẽ phân tích kiến trúc của UltraChat – một trong những tập dữ liệu hội thoại quy mô lớn và đa dạng nhất hiện nay, đồng thời thảo luận về phương pháp sử dụng dữ liệu tổng hợp để nâng cao năng lực định hướng và phản hồi của các mô hình ngôn ngữ lớn.

📌 THÔNG TIN TỔ CHỨC:

Thời gian: 14h30, Thứ 4, ngày 10/06/2026

Địa điểm: Phòng Lab 301-GD2, Khoa Công nghệ thông tin, Trường Đại học Đại Nam

Diễn giả trình bày: Lê Tuấn Dũng, Nguyễn Văn Vinh

Buổi Seminar là không gian trao đổi học thuật, chia sẻ kinh nghiệm nghiên cứu dành cho các cán bộ giảng viên và sinh viên có định hướng phát triển các đề tài liên quan đến kỹ thuật học máy ứng dụng và xử lý dữ liệu lớn.

Kính mời quý thầy cô và các bạn sinh viên quan tâm tham dự.

Photos from DNU - AIoT Lab Khoa Công nghệ thông tin's post 05/06/2026

Hệ thống mạng làm sao để "tự vệ" chớp nhoáng trước hacker? 🛑💻

Câu trả lời vừa được bật mí cực kỳ ấn tượng trong báo cáo chuyên đề bảo mật hạ tầng mạng vừa qua! Thay vì những lý thuyết khô khan, bạn Lê Hoàng Việt (lớp KHMT 19-01) đã mang đến một góc nhìn đầy thực chiến: Đưa Machine Learning vào hệ thống IDS/IPS.

Nhờ các thuật toán được tối ưu hóa, hệ thống giờ đây không chỉ phòng ngự thụ động mà còn có khả năng "tự học", tự động nhận diện và chặn đứng các mối đe dọa an ninh mạng theo thời gian thực. ⚡

Một phần trình bày "nhiều não" và cực kỳ xuất sắc. Cùng thả tim cho tinh thần nghiên cứu siêu xịn xò của sinh viên Hoàng Việt nhé! ❤️🔥

Photos from DNU - AIoT Lab Khoa Công nghệ thông tin's post 28/05/2026

Giọng nói của chúng ta không chỉ truyền đạt thông tin mà còn ẩn chứa cả một thế giới cảm xúc! Việc dạy cho máy tính cách "lắng nghe" và thấu hiểu những cảm xúc này đang là một trong những bài toán thú vị nhất của Trí tuệ nhân tạo.

Vừa qua, sinh viên Nguyễn Văn Huy đã có một buổi báo cáo chuyên đề xuất sắc với đề tài: "Hệ thống phân loại cảm xúc dựa trên giọng nói" (Speech Emotion Recognition - SER).

Qua phần trình bày của Huy, chúng ta đã cùng đi sâu vào:

🎵 Cách AI "nghe": Trích xuất các đặc trưng âm thanh phức tạp (như cao độ, cường độ, nhịp điệu) từ tín hiệu giọng nói.

🧠 Cách AI "hiểu": Ứng dụng các mô hình học máy và học sâu (Deep Learning) để phân loại chính xác các trạng thái cảm xúc: Vui, buồn, giận dữ, ngạc nhiên,...

💡 Tiềm năng ứng dụng: Từ việc nâng cao chất lượng tổng đài chăm sóc khách hàng, hỗ trợ chẩn đoán tâm lý trong y tế, đến việc tạo ra các trợ lý ảo thông minh và "người" hơn.

Sự tìm tòi và nỗ lực nghiên cứu của Nguyễn Văn Huy đã mang đến một góc nhìn rất thực tế và mang tính ứng dụng cao. Đây là minh chứng rõ nét cho tinh thần ham học hỏi và khả năng nắm bắt công nghệ mới của sinh viên chúng ta!

Gửi một tràng pháo tay thật lớn chúc mừng Nguyễn Văn Huy đã hoàn thành xuất sắc đề tài này! 👏👏 Cùng chờ đón những dự án bùng nổ tiếp theo từ các bạn sinh viên nhé!

26/05/2026

[SEMINAR KHOA CNTT - DNU] SEMINAR KHOA HỌC: ỨNG DỤNG AI TRONG XỬ LÝ ÂM THANH VÀ BẢO MẬT HỆ THỐNG MẠNG

Kính gửi các cán bộ, giảng viên và sinh viên Khoa Công nghệ thông tin, Trường Đại học Đại Nam.

Tiếp tục đẩy mạnh các hoạt động nghiên cứu khoa học chuyên sâu, Khoa Công nghệ thông tin trân trọng thông báo tổ chức buổi Seminar định kỳ vào ngày 27/05/2026. Sự kiện tuần này tập trung phân tích hai hướng ứng dụng quan trọng của Trí tuệ nhân tạo: Xử lý ngôn ngữ/âm thanh và An toàn thông tin.

Nội dung chi tiết của buổi Seminar bao gồm:

🔹 Chuyên đề 1: Báo cáo tổng quan hệ thống phân loại cảm xúc dựa trên giọng nói (Speech Emotion Recognition)
Báo cáo cung cấp cái nhìn toàn cảnh về kiến trúc hệ thống phân loại cảm xúc thông qua tín hiệu giọng nói. Nội dung đi sâu vào các phương pháp trích xuất đặc trưng âm học và xây dựng mô hình phân loại. Những kết quả nghiên cứu này có giá trị bổ trợ rất lớn cho các định hướng phát triển hệ thống xác thực danh tính và xử lý âm thanh sinh trắc học chuyên sâu.

🔹 Chuyên đề 2: Ứng dụng Machine Learning trong hệ thống IDS/IPS
Chuyên đề thứ hai giải quyết bài toán bảo mật hạ tầng mạng. Báo cáo viên sẽ trình bày cách thức các thuật toán Machine Learning được tối ưu hóa để tích hợp vào hệ thống phát hiện và ngăn ngừa xâm nhập (IDS/IPS), từ đó nâng cao khả năng phản ứng tự động trước các mối đe dọa an ninh mạng theo thời gian thực.

📌 THÔNG TIN TỔ CHỨC:

Thời gian: 14h30, Thứ 4, ngày 27/05/2026
Địa điểm: Phòng Lab 301-GD2, Khoa Công nghệ thông tin, Trường Đại học Đại Nam
Trình bày: Nguyễn Văn Huy, Lê Hoàng Việt

Buổi Seminar là môi trường trao đổi học thuật lý tưởng để các cán bộ giảng viên và sinh viên củng cố nền tảng kiến thức, phục vụ trực tiếp cho quá trình thực hiện đồ án và các dự án nghiên cứu khoa học công nghệ.

Kính mời quý thầy cô và các bạn sinh viên quan tâm tham dự.

19/05/2026

TensorRT – Tại sao nhiều mô hình AI có accuracy cao nhưng vẫn không deploy production

Trong nhiều dự án AI hiện nay, việc huấn luyện được một mô hình có accuracy cao mới chỉ là một nửa bài toán. Một mô hình Computer Vision có thể hoạt động rất tốt trong môi trường nghiên cứu bằng PyTorch trên GPU mạnh như RTX 4090 hoặc A100. Tuy nhiên, khi triển khai thực tế vào hệ thống camera công nghiệp, xe tự hành, edge device như Jetson, backend xử lý video real-time, smart surveillance,... thì bài toán không còn chỉ là accuracy. Lúc này, hệ thống bắt đầu đối mặt với các vấn đề:
• latency quá cao
• GPU utilization thấp
• VRAM usage lớn
• throughput không ổn định
• không đạt FPS yêu cầu
• power consumption vượt giới hạn thiết bị edge

Một mô hình YOLOv8 có thể chạy rất tốt trong notebook, nhưng lại không thể đáp ứng yêu cầu inference 30 FPS liên tục trong môi trường production.

Đây chính là bài toán TensorRT được sinh ra để giải quyết.

Trong bài viết này, chúng ta sẽ cùng phân tích:
• TensorRT là gì và vì sao nó giống một AI compiler hơn là runtime thông thường
• Cách TensorRT tối ưu neural network ở level GPU ex*****on
• Những kỹ thuật như graph fusion, tactic selection, FP16/INT8 quantization hoạt động ra sao
• Pipeline triển khai AI từ PyTorch → ONNX → TensorRT → Production
• Các bottleneck thực tế trong inference system hiện đại
• Những giới hạn và trade-off khi dùng TensorRT trong production

Mục tiêu không chỉ là hiểu TensorRT hoạt động thế nào, mà còn hiểu vì sao inference optimization đang trở thành một phần cốt lõi của AI Engineering hiện đại.

TensorRT là một inference SDK và deep learning optimizer được phát triển bởi NVIDIA nhằm tối ưu việc chạy neural network trên GPU NVIDIA. Khác với PyTorch hay TensorFlow — vốn tập trung vào huấn luyện mô hình — TensorRT tập trung gần như hoàn toàn vào inference optimization. Mục tiêu của TensorRT:
• giảm latency inference
• tăng throughput
• giảm memory footprint
• tận dụng tối đa Tensor Cores và GPU architecture của NVIDIA

TensorRT thường hoạt động như một lớp tối ưu nằm giữa:

deep learning framework

và hardware ex*****on layer

Pipeline phổ biến hiện nay thường là:

PyTorch → export ONNX → TensorRT engine build → deployment bằng Triton / C++ / CUDA runtime

Điểm quan trọng là: TensorRT không chạy mô hình theo cách framework gốc thực hiện. Thay vào đó, nó:
• phân tích computation graph
• tối ưu ex*****on graph
• explore nhiều ex*****on tactics khác nhau
• benchmark nhiều ex*****on paths
• build ex*****on engine tối ưu cho GPU cụ thể

Trước khi có TensorRT, nhiều hệ thống inference thường chạy trực tiếp bằng:
• PyTorch eager ex*****on
• TensorFlow runtime
• ONNX Runtime GPU backend

Cách này hoạt động tốt trong research, nhưng khi scale production thường gặp nhiều vấn đề:
• kernel launch overhead lớn
• memory access không tối ưu
• GPU occupancy thấp
• latency không ổn định
• khó tận dụng Tensor Cores hiệu quả

TensorRT xuất hiện để giải quyết chính các bottleneck này. Nó cho phép:
• tối ưu graph ở mức thấp hơn framework
• build engine chuyên biệt cho GPU deploy
• tận dụng mixed precision inference
• tăng tốc inference real-time đáng kể

Trong nhiều hệ thống thực tế, TensorRT có thể giúp inference:
• nhanh hơn 2–5x so với PyTorch eager ex*****on
• nhanh hơn đáng kể khi dùng FP16 hoặc INT8 optimization

Điểm quan trọng là TensorRT engines thường phụ thuộc mạnh vào GPU architecture.

Một engine build cho A100, RTX 4090, Jetson Orin có thể không tối ưu hoặc thậm chí không tương thích hoàn toàn trên phần cứng khác. Lý do là vì tactic selection, Tensor Core optimization và kernel ex*****on đều phụ thuộc vào hardware capability cụ thể.

TensorRT không chỉ “load model rồi chạy”. Bên trong, nó thực hiện nhiều bước optimization khá giống compiler optimization trong HPC systems.

1. Builder Phase và Runtime Phase

TensorRT thường gồm hai giai đoạn chính:

Builder Phase:
• optimize graph
• tactic search
• kernel benchmarking
• quantization optimization
• engine generation

Runtime Phase:
• load serialized engine
• execute optimized inference pipeline

Đây là lý do build engine có thể mất khá nhiều thời gian, nhưng runtime inference sau đó lại rất nhanh.

2. Graph Optimization

Sau khi nhận ONNX graph, TensorRT sẽ:
• loại bỏ node dư thừa
• constant folding
• simplify graph
• tensor memory reuse
• graph fusion

Ví dụ Conv → BatchNorm → ReLU có thể được fuse thành một CUDA kernel duy nhất.

Điều này giúp:
• giảm memory read/write
• giảm kernel launch overhead
• tăng cache locality
• tăng throughput inference

Trong nhiều modern GPU workloads, đặc biệt với bandwidth-bound inference systems, memory movement đôi khi còn đắt hơn computation.

3. Tactic Selection

Đây là một trong những phần quan trọng nhất của TensorRT.

Với mỗi layer, TensorRT không chỉ có một implementation duy nhất.

Ví dụ với convolution:
• Winograd convolution
• implicit GEMM
• direct convolution
• Tensor Core kernels
• fused kernels

TensorRT sẽ explore nhiều ex*****on tactics khác nhau cho từng layer, bao gồm:
• kernel implementation
• tensor layouts
• Tensor Core ex*****on paths
• fusion strategy
• cuDNN tactics

Sau đó benchmark trực tiếp trên GPU deploy thực tế để chọn implementation tối ưu dựa trên:
• tensor shape
• memory alignment
• SM occupancy
• shared memory usage
• Tensor Core availability
• batch size

Đây là lý do cùng một model nhưng latency trên RTX 4090, A100, Jetson Orin có thể khác nhau rất nhiều.

4. FP16 và INT8 Quantization

TensorRT hỗ trợ:
• FP32
• FP16
• INT8 inference

INT8 quantization không đơn giản chỉ là convert float32 thành int8.

TensorRT cần:
• calibration dataset
• activation range estimation
• tensor scale computation
• quantization mapping

Trong production systems hiện nay, INT8 deployment thường sử dụng:
• PTQ (Post-Training Quantization)
• hoặc QAT (Quantization-Aware Training)

Nếu calibration hoặc quantization pipeline không tốt accuracy có thể giảm mạnh. Đổi lại, INT8 có thể:
• giảm memory footprint đáng kể
• tăng throughput inference lớn
• giảm power consumption
• tận dụng Tensor Cores hiệu quả hơn

Đây là lý do TensorRT rất phổ biến trong:
• edge AI
• autonomous systems
• industrial AI
• real-time analytics

5. Dynamic Shape Optimization

Trong production:

input resolution thay đổi

batch size không cố định

sequence length khác nhau

TensorRT phải build optimization profiles cho từng shape range.

Nếu không optimize tốt:
• memory reallocation tăng mạnh
• kernel ex*****on kém hiệu quả
• latency biến động lớn
• throughput giảm đáng kể

Đây cũng là lý do inference engineering thường phức tạp hơn train model.

Một production AI system không chỉ cần “accuracy cao”. Nó còn cần:
• latency thấp
• throughput ổn định
• efficient memory usage
• thermal stability
• hardware-aware optimization
• fault tolerance

TensorRT đóng vai trò cực kỳ quan trọng trong các hệ thống:
• real-time object detection
• OCR pipeline
• segmentation
• video analytics
• autonomous driving
• smart factory systems

1. Ví dụ thực tế: hệ thống camera công nghiệp

Một nhà máy cần detect lỗi sản phẩm bằng camera tốc độ cao:
• yêu cầu 30–60 FPS
• latency dưới 20ms
• chạy 24/7
• deploy trên Jetson AGX Orin

Nếu chạy trực tiếp bằng PyTorch:
• latency không ổn định
• memory overhead cao
• FPS không đạt yêu cầu

Giải pháp phổ biến:
PyTorch → ONNX → TensorRT engine → deploy bằng C++ inference service

Lúc này engine.plan hoặc engine.trt mới là thứ thực sự chạy trong production.

2. Bottleneck thực tế thường không nằm ở model

Một insight khá thú vị là trong nhiều Computer Vision systems, inference không phải bottleneck lớn nhất. Thứ tốn thời gian thường là:
• image decode
• resize / normalize
• CPU ↔ GPU synchronization
• PCIe transfer
• post-processing NMS
• memory fragmentation
• video streaming pipeline

Có những hệ thống GPU inference chỉ mất khoảng 5ms, nhưng end-to-end latency lại lên tới 40ms vì bottleneck nằm ở video decode và data transfer.

Quy trình triển khai TensorRT trong thực tế

Bước 1: Huấn luyện mô hình bằng PyTorch hoặc TensorFlow
Tập trung tối ưu accuracy và validation metrics.

Bước 2: Export sang ONNX
Sử dụng ONNX như chuẩn trung gian để deploy.

Bước 3: Build TensorRT Engine
TensorRT sẽ:
• optimize graph
• benchmark tactics
• apply quantization
• build ex*****on engine

Bước 4: Validate inference
Kiểm tra:
• accuracy drift
• latency
• throughput
• memory usage

Bước 5: Deploy production
Tích hợp engine vào:
• Triton Inference Server
• C++ backend
• Jetson deployment
• CUDA runtime pipeline

TensorRT không chỉ là công cụ tăng tốc inference, nó là một lớp optimization cực kỳ quan trọng giúp neural network có thể chạy hiệu quả trong production thực tế.

18/05/2026

[SEMINAR KHOA CNTT - DNU] SEMINAR KHOA HỌC: CÔNG NGHỆ SPEECH ANTI-SPOOFING VÀ KIẾN TRÚC HỆ THỐNG PHẦN MỀM

Kính gửi các cán bộ, giảng viên và sinh viên Khoa Công nghệ thông tin, Trường Đại học Đại Nam.

Khoa Công nghệ thông tin trân trọng thông báo tổ chức buổi Seminar chuyên đề ngày 20/05/2026. Sự kiện tuần này tập trung vào các công nghệ bảo mật tiên tiến nhất trong xử lý tín hiệu âm thanh, đồng thời cập nhật các báo cáo chuyên sâu về kỹ nghệ phần mềm và kiến trúc cơ sở dữ liệu.

Nội dung chi tiết của buổi Seminar bao gồm:
🔹 Chuyên đề chính: Speech Anti-Spoofing
Báo cáo tập trung phân tích tổng quan và đánh giá các thuật toán tiên tiến nhất hiện nay trong việc nhận diện và ngăn chặn các hình thức tấn công giả mạo giọng nói (synthetic speech, voice conversion). Đây là cơ sở lý thuyết và công nghệ cốt lõi để đảm bảo tính bảo mật cho các hệ thống nhận dạng sinh trắc học, đóng góp trực tiếp vào quá trình nghiên cứu và phát triển kiến trúc an toàn của dự án V-BioVoice đang được triển khai.

🔹 Các báo cáo chuyên đề bổ sung:
Tính chất ACID trong xử lý giao dịch ngân hàng: Bản báo cáo hoàn chỉnh phân tích nguyên tắc thiết kế luồng xử lý đảm bảo tính toàn vẹn dữ liệu trong các hệ thống tài chính có tính rủi ro cao.

📌 THÔNG TIN TỔ CHỨC:

Thời gian: 14h30, Thứ 4, ngày 20/05/2026

Địa điểm: Phòng Lab 301-GD2, Khoa Công nghệ thông tin, Trường Đại học Đại Nam
Trình bày: Trần Trường Giang, Đỗ Quang Minh

Buổi Seminar là không gian trao đổi học thuật dành cho các cán bộ giảng viên và sinh viên có định hướng nghiên cứu chuyên sâu về an toàn thông tin, trí tuệ nhân tạo và kỹ thuật phần mềm.

Kính mời quý thầy cô và các bạn sinh viên quan tâm tham dự

Photos from DNU - AIoT Lab Khoa Công nghệ thông tin's post 17/05/2026

ONNX – Vì sao gần như mọi hệ thống AI production hiện đại đều cần nó?

Rất nhiều mô hình AI đạt accuracy cực cao khi train trên GPU mạnh như A100, nhưng lại gặp vấn đề khi triển khai thực tế:

• Không chạy được trên Jetson / edge device
• Không tích hợp được vào hệ thống C++
• Runtime quá nặng vì phụ thuộc PyTorch hoặc TensorFlow
• Latency cao, khó tối ưu inference real-time

Đây cũng là lý do ONNX (Open Neural Network Exchange) trở thành “chuẩn trung gian” quan trọng trong AI Engineering và MLOps hiện đại.

Trong bài viết này, mình breakdown khá chi tiết:

• ONNX thực chất là gì và tại sao nó được ví như “Docker image cho AI”
• Cách ONNX biểu diễn computation graph và weights
• Vì sao ONNX giúp tách biệt training và deployment
• Pipeline thực tế: PyTorch → ONNX → TensorRT → Jetson / C++ deployment
• Các kỹ thuật optimize inference như:

Graph Fusion

Quantization INT8 / FP16

Constant Folding
• So sánh triển khai có và không dùng ONNX
• Vai trò của ONNX Runtime, TensorRT, OpenVINO, onnx.js trong production AI

Điểm mình thấy thú vị nhất là ONNX không phải framework train model, mà là “ngôn ngữ chung” giúp mô hình AI có thể chạy đa nền tảng — từ server, edge device đến web browser.

13/05/2026

15 bài báo nền tảng của AI hiện đại 🔥

(Tóm lại là bao gồm Transformer và các bài báo sau đó các bạn nhé)

1️⃣ Attention Is All You Need
2017, Google
Thay thế RNN bằng cơ chế self-attention, giúp mô hình có thể xử lý song song ở quy mô lớn.
🌐 https://arxiv.org/abs/1706.03762

2️⃣ BERT
2018, Google
Giới thiệu biểu diễn ngôn ngữ hai chiều sâu thông qua Masked Language Modeling, hay MLM.
🌐 https://arxiv.org/abs/1810.04805

3️⃣ GPT-2
2019, OpenAI
Chứng minh rằng dự đoán từ tiếp theo có thể giúp mô hình trở thành một “người học đa nhiệm” theo cách không giám sát.
🌐 https://openai.com/research/better-language-models

4️⃣ Scaling Laws for Neural Language Models
2020, OpenAI
Công thức hóa bằng toán học việc tăng compute, dữ liệu và số tham số có thể cải thiện hiệu năng mô hình theo cách dự đoán được.
🌐 https://arxiv.org/abs/2001.08361

5️⃣ GPT-3
2020, OpenAI
Với 175 tỷ tham số, GPT-3 mở ra khả năng “in-context learning”, tức học ngay trong ngữ cảnh mà không cần cập nhật trọng số mô hình.
🌐 https://arxiv.org/abs/2005.14165

6️⃣ Vision Transformer, ViT
2020, Google
Đưa Transformer vào lĩnh vực thị giác máy tính bằng cách xem các patch ảnh như một chuỗi token.
🌐 https://arxiv.org/abs/2010.11929

7️⃣ DALL-E
2021, OpenAI
Kết hợp discrete VAE với autoregressive Transformer để tạo ảnh từ văn bản theo kiểu zero-shot.
🌐 https://arxiv.org/abs/2102.12092

8️⃣ Retrieval-Augmented Generation, RAG
2020, Meta
Kết hợp Dense Passage Retrieval, DPR, với mô hình sinh seq2seq để giúp câu trả lời được grounding trên kho dữ liệu bên ngoài.
🌐 https://arxiv.org/abs/2005.11401

9️⃣ LoRA
2021, Microsoft
Tạo ra bước tiến lớn cho parameter-efficient fine-tuning, PEFT, thông qua các ma trận phân rã hạng thấp.
🌐 https://arxiv.org/abs/2106.09685

🔟 InstructGPT / RLHF
2022, OpenAI
Sử dụng Proximal Policy Optimization, PPO, để căn chỉnh mô hình theo phản hồi và sở thích của con người.
https://arxiv.org/abs/2203.02155

1️⃣1️⃣ Chain-of-Thought Prompting
2022, Google
Mở khóa khả năng suy luận có hệ thống thông qua các bước lập luận trung gian.
🌐 https://arxiv.org/abs/2201.11903

1️⃣2️⃣ Constitutional AI
2022, Anthropic
Đặt nền móng cho RLAIF, nơi mô hình tự phê bình và tự điều chỉnh dựa trên một bộ nguyên tắc được định nghĩa trước.
🌐 https://arxiv.org/abs/2212.08073

1️⃣3️⃣ AlphaFold 2
2021, DeepMind
Giải quyết bài toán dự đoán cấu trúc protein 3D thông qua kiến trúc Evoformer.
🌐 https://nature.com/articles/s41586-021-03819-2

1️⃣4️⃣ Denoising Diffusion, DDPM
2020, UC Berkeley
Sử dụng variational inference cho quá trình khuếch tán Markov ngược. Đây là một trong những nền tảng toán học quan trọng đứng sau Stable Diffusion.
🌐 https://arxiv.org/abs/2006.11239

1️⃣5️⃣ ReAct
2022, Google / Princeton
Kết hợp các bước suy luận với hành động cụ thể trong môi trường, ví dụ như gọi API hoặc tra cứu thông tin.
🌐 https://arxiv.org/abs/2210.03629

Bài viết gốc: https://www.linkedin.com/posts/aamero_ml-deeplearning-airesearch-activity-7449747269857267713-h5Mn?utm_source=social_share_send&utm_medium=member_desktop_web&rcm=ACoAAB8zGzgBCs7tk97g0kh_mpAfaczB4jwFYeo

11/05/2026

🚀[SEMINAR KHOA CNTT - DNU] ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG KIỂM THỬ PHẦN MỀM VÀ THIẾT KẾ 3D🚀

Kính gửi các cán bộ, giảng viên và sinh viên Khoa Công nghệ thông tin, Trường Đại học Đại Nam.

Nhằm tiếp tục đẩy mạnh các hoạt động nghiên cứu khoa học và cập nhật công nghệ mới, Khoa Công nghệ thông tin trân trọng thông báo tổ chức buổi Seminar chuyên đề ngày 13/05/2026. Sự kiện lần này tập trung phân tích sự can thiệp và hỗ trợ của Trí tuệ nhân tạo (AI) trong hai quy trình phức tạp: Kiểm thử chất lượng phần mềm và đồ họa kỹ thuật số.

Nội dung chi tiết của buổi Seminar bao gồm:

🔹 Chủ đề 1: AI-powered Testing

Trình bày về các hệ thống kiểm thử thế hệ mới sử dụng AI. Nội dung tập trung vào cách các mô hình học máy tự động tạo kịch bản kiểm thử, dự đoán các vùng mã nguồn có nguy cơ phát sinh lỗi cao và giảm thiểu thời gian kiểm thử hồi quy (regression testing) trong các dự án phần mềm quy mô lớn.

🔹 Chủ đề 2: Ứng dụng xử lý AI trong thiết kế và tạo mô hình 3D

Chuyên đề thứ hai đi sâu vào khía cạnh ứng dụng thuật toán AI trong việc tự động hóa quá trình xây dựng lưới đa giác, tạo lập bề mặt và đề xuất cấu trúc cho các mô hình 3D. Những kỹ thuật này đang góp phần rút ngắn thời gian sản xuất tài nguyên đồ họa cho các lĩnh vực mô phỏng, kiến trúc và giải trí.
📌 THÔNG TIN TỔ CHỨC:

⏰ Thời gian: 14h30, Thứ 4, ngày 13/05/2026
🏢 Địa điểm: Phòng Lab 301-GD2, Khoa Công nghệ thông tin, Trường Đại học Đại Nam
Người trình bày: Đinh Thị Ngọc Bích và Đoàn Trần Cảnh

Buổi Seminar là không gian trao đổi học thuật dành cho các cán bộ giảng viên và sinh viên có định hướng nghiên cứu chuyên sâu về công nghệ phần mềm và trí tuệ nhân tạo trực quan.

Kính mời quý thầy cô và các bạn sinh viên quan tâm tham dự.

Want your school to be the top-listed School/college in Ha Dong?

Click here to claim your Sponsored Listing.

Location

Category

Telephone

Address


Số 1 Phố Xốm, Phú Lãm, Hà Đông, Hag Nội
Ha D**g
10020