27/08/2024
Tôi đứng đầu team phát triển một nền tảng ERP cloud-native cho các doanh nghiệp vận tải hành khách.
Một trong những microservice quan trọng nhất của chúng tôi là hệ thống bán vé điện tử, Để đảm bảo tính toàn vẹn mỗi vé xuất ra phải được ký bằng chữ ký số của doanh nghiệp
Ban đầu, chúng tôi sử dụng giải pháp khá củ chuối là dung luôn cái USB key chuẩn PKCS #11 để để ký. Chúng tôi phải viết một wrapper service bằng Python để tương tác với driver của USB token thông qua FFI (Foreign Function Interface). Giải pháp này hoạt động khá tốt cho các khách hàng nhỏ và vừa, với throughput khoảng 5-20 chữ ký mỗi phút. Mà cái USB này nằm trên 1 con laptop nên phải dùng queue pull về , rồi lại vấn đề mất iện mất mạng nhưng đại khái thì nó cũng work.
Tuy nhiên, khi onboard một enterprise client với khối lượng vé lớn, vấn đề phát sinh khi số vé phải ký vọt lên 1000+ chữ ký mỗi phút trong giờ cao điểm.
Sau khi phân tích nhiều giải pháp, bao gồm cả việc triển khai HSM (Hardware Security Module) on-premise, chúng tôi quyết định chọn AWS CloudHSM. Đây là một giải pháp cloud-based HSM cung cấp các lợi ích sau:
Hiệu suất cao: Với khả năng xử lý hàng nghìn giao dịch mã hóa mỗi giây, AWS CloudHSM dễ dàng đáp ứng yêu cầu về throughput của chúng tôi.
Bảo mật cấp doanh nghiệp: Sử dụng FIPS 140-2 Level 3 validated HSMs, đảm bảo an toàn cho các khóa mật mã.
Khả năng mở rộng: Cho phép chúng tôi thêm hoặc xóa HSM theo nhu cầu, phù hợp với mô hình auto-scaling của hệ thống.
Tích hợp seamless: Cung cấp PKCS #11 API, cho phép chúng tôi migrate code hiện có với ít thay đổi.
Độ tin cậy cao: Với SLA 99.99%, đảm bảo high availability cho service ký số của chúng tôi.
Quá trình migration bao gồm việc refactor service wrapper để sử dụng AWS CloudHSM Client SDK thay vì driver USB token.
Kết quả là ấn tượng: Hệ thống mới có thể xử lý hơn 2000 chữ ký mỗi phút, vượt xa yêu cầu của khách hàng. Latency trung bình cho mỗi operation ký số giảm từ 500ms xuống còn 50ms. Hơn nữa, việc sử dụng CloudHSM cũng giúp chúng tôi đáp ứng các yêu cầu về compliance như PCI DSS và GDPR.
Nếu muốn nghe về CloudHSM hoặc các dịch vụ khác của AWS các bạn đăng ký event free của AWS tại HN trong link cuối bài nhé.
https://aws.amazon.com/events/cloud-day-vietnam/?trk=f34acffd-2980-456a-9280-670814f121f3&sc_channel=em
Có 2-3 talk về RAG, 1 bài về AWS Graviton cũng khá hay mọi người tham khảo Agenda
31/05/2024
🤯 Hạn chế của LLM:
Thông tin lỗi thời: LLM biết gì thì biết tới lúc huấn luyện thôi, không cập nhật tự động như newsfeed của bạn đâu.
Chi phí: Huấn luyện LLM không khác gì đốt tiền, cần nhiều tài nguyên tính toán.
Ngữ cảnh dài hạn: Nhớ ngắn hạn, kiểu như bạn quên password ấy.
Khả năng giải thích: Đen thui, không biết tại sao lại trả lời vậy, giống như "chuyện tình cảm không ai hiểu nổi" 😂.
🔧 Giải pháp RAG:
RAG là gì?: Kết hợp LLM với khả năng truy xuất thông tin từ ngoài, kiểu như tra Google rồi mới trả lời.
Ưu điểm: Thông tin cập nhật liên tục, không cần huấn luyện lại, nhớ ngữ cảnh tốt hơn.
🛠️ LangChain:
LangChain là gì?: Framework giúp anh em tích hợp LLM vào app dễ dàng như ăn kẹo.
Chức năng chính: Tích hợp dữ liệu, xử lý ngôn ngữ, hỗ trợ truy vấn.
Ưu điểm: Dễ tích hợp, linh hoạt, hiệu quả.
🏁 Kết luận:
LLM có nhiều hạn chế, nhưng với RAG và LangChain thì mọi thứ dễ thở hơn nhiều. Ai muốn làm việc với AI mà không muốn đau đầu thì check ngay!
18/04/2024
Nhân tiện con coin được anh em gọi là cú lừa Omni mới list binance, ôn lại câu chuyện của Omni Layer Protocol .
Nếu nói về token thì đừng quên ông cố nội Omni Layer Protocol! Ra đời từ năm 2013, ông là người tiên phong trong việc tạo ra các token trên blockchain Bitcoin, mở đường cho sự ra đời của các stablecoin như Tether (USDT). Đại khái nó tạo ra một supper layer chạy trên Bitcoin blockchain , inject cái data vào, để tạo ra giao dịch token . Ngày đó anh em ngồi code với thằng này , USDT dính cưởng mấy phất vì giao dịch trên Bitcoin thì hợp lệ , nhưng trên Omni thì không . Tụi hacker send fake transaction rút được kha khá tiền . Nói chung là thằng Quốc Anh code ngu là chính . Cứ decode ra là phập ,
Bitcoin Cash: Năm 2017, gia đình Bitcoin xảy ra một cuộc nội chiến. Một nhóm người tin rằng Bitcoin cần phải "to con" hơn để chứa nhiều giao dịch hơn, nên họ tách ra và tạo ra Bitcoin Cash. Giống như một người anh em họ cơ bắp, Bitcoin Cash có kích thước khối lớn hơn, cho phép xử lý nhiều giao dịch hơn nhưng lại hy sinh một chút về tính bảo mật. Đội này về cơ bản không thích SegWit họ cũng phân tích rõ tính hạn chế của Segwit , nên quyết tâm fork chứ không nâng cấp ( rồi sau đó rất nhiều lỗi xảy ra với các Segwit address )
SegWit và Taproot: Trong khi đó, Bitcoin vẫn tiếp tục phát triển với những nâng cấp như SegWit và Taproot. SegWit giống như một chiếc áo nịt bụng, giúp Bitcoin thon gọn hơn bằng cách di chuyển một số dữ liệu ra khỏi khối chính. Taproot lại như một chiếc mũ tàng hình, giúp các giao dịch phức tạp trông giống như những giao dịch bình thường, tăng cường tính riêng tư và hiệu quả.
BRC-20: Và rồi, vào năm 2023, một đứa cháu mới xuất hiện: BRC-20. Lấy cảm hứng từ ông cố nội Omni Layer Protocol (một giao thức từng được sử dụng để tạo ra các token trên blockchain Bitcoin), BRC-20 cho phép tạo ra các token mới trên blockchain Bitcoin, mở ra một kỷ nguyên mới cho các loại tiền điện tử "ăn theo" Bitcoin.
21/02/2024
Mình thật sự ấn tượng với openobserve, một observability platform ( Logs , Metrics , Traces ), em nó có khả năng nén và truy xuất dữ liệu xuất sắc . API rất dễ hiểu mạch lạc , biểu đồ đẹp miễn chê , tốc độ bàn thờ. Hiện đang thử nghiệm cho fcs, ngon thì dùng production cho Metaway. Theo quảng cáo khả năng nén là 140x, thực tế dữ liệu bên mình cho thấy khả năng nén cỡ 45x. Ngon hơn nhiều mấy bác giá như loki.