08/05/2023
Nền tảng dữ liệu với 3 chữ Data
1. Data Warehouse - sắp xếp dữ liệu của bạn ngăn nắp, cứ vào quán bốc thuốc của mấy ông thầy thuốc nam là thấy ngay, hoặc vào thư viện sách - dữ liệu ban đầu của bạn hỗn độn, nhưng vào đây là được sắp xếp ngăn nắp để lấy ra sử dụng cho nhanh, thiệt là nhanh
2. Data Lake - sinh ra để làm chỗ chứa cái Data Warehouse ở trên và các thể loại dữ liệu phi cấu trúc, hoặc bán phi cấu trúc kiểu file, logo file, video, âm thanh,...
3. Data Mart - là thể loại dữ liệu đã được sắp xếp theo các chủ đích luôn rồi, còn cao hơn cả Data Warehouse nữa - kiểu như sắp xếp cho phòng mua hàng, cho phòng kinh doanh - và thường được sắp xếp theo kiểu của các công cụ phân tích - được chia thành chiều và giá trị phân tích rồi - giúp cho mấy bạn nghiệp vụ chỉ cần rị em nó ra, ném lên màn hình để giải quyết các ý tưởng, nhu cầu phân tích của mình
Một từ mà bạn cần phải học nữa là ETL/ELT là công việc để chuyển đổi dữ liệu (giờ đây, các tài liệu của Tây viết luôn thành từ Data Transformation luôn, giảm hẳn cái từ ETL/ELT vì nó quá kỹ thuật)
Một hệt thống đơn giản của Data Platform kiểu kiểu như hình dưới đây
- Trích BSD Insight
11/12/2022
10/12/2022
29/11/2022
19/11/2022
17/11/2022
15/11/2022
24/10/2022
23/10/2022
21/10/2022
20/10/2022
13/10/2022