Một giản đồ Snowflake tương đương với giản đồ sao. “Một lược đồ được gọi là Snowflake nếu một hoặc nhiều bảng dimension không kết nối trực tiếp với bảng dữ kiện mà phải kết nối thông qua các bảng dimension khác.”
Snowflake Schema là sự mở rộng của lược đồ sao trong đó mỗi điểm của ngôi sao bùng nổ thành nhiều điểm hơn. Nó được gọi là giản đồ Snowflake vì biểu đồ của giản đồ Snowflake giống với mộtSnowflake. Snowflaking là một phương pháp chuẩn hóa bảng dimension trong lược đồ STAR. Khi chúng tôi chuẩn hóa hoàn toàn tất cả các bảng kích thước, cấu trúc kết quả giống như mộtSnowflake với bảng dữ kiện ở giữa.
Snowflaking được sử dụng để phát triển hiệu suất của các truy vấn cụ thể. Lược đồ được lập sơ đồ với mỗi dữ kiện được bao quanh bởi các dimension liên quan của nó và những dimension đó có liên quan đến các dimension khác, phân nhánh thành một mô hìnhSnowflake.
Snowflake Schema bao gồm một bảng dữ kiện được liên kết với nhiều bảng dimension, có thể được liên kết với các bảng dimension khác thông qua mối quan hệ nhiều đối một. Các bảng trong Snowflake Schema thường được chuẩn hóa thành dạng chuẩn thứ ba. Mỗi bảng dimension thực hiện chính xác một cấp trong hệ thống phân cấp.
Sơ đồ sau đây cho thấy một giản đồSnowflake có hai chiều, mỗi chiều có ba mức. Snowflake Schema có thể có bất kỳ số dimension nào và mỗi dimension có thể có bất kỳ số cấp độ nào.
Ví dụ: Hình cho thấy một Snowflake Schema với bảng dữ kiện Bán hàng, với các bảng dimension Cửa hàng, Vị trí, Thời gian, Sản phẩm, Dòng và Gia đình. dimension Thị trường có hai bảng dimension với Cửa hàng là bảng dimension chính và Vị trí là bảng dimension bên ngoài. dimension sản phẩm có ba bảng dimension với Sản phẩm là bảng dimension chính và bảng Dòng và Dòng là bảng dimension bên ngoài.
Một giản đồ hình sao lưu trữ tất cả các thuộc tính cho một dimension vào một bảng không chuẩn hóa. Điều này cần nhiều dung lượng đĩa hơn so với một giản đồSnowflake chuẩn hóa hơn. Snowflaking chuẩn hóa dimension bằng cách di chuyển các thuộc tính có số lượng thấp vào các bảng dimension riêng biệt có liên quan đến bảng dimension cốt lõi bằng cách sử dụng các khóa ngoại. Không nên trượt tuyết với mục đích duy nhất là giảm thiểu dung lượng ổ đĩa, vì nó có thể tác động xấu đến hiệu suất truy vấn.
Trong snowflake, các bảng lược đồ được chuẩn hóa để xóa phần dư thừa. Trong các bảng kích thướcSnowflake bị hỏng thành các bảng nhiều kích thước.
Hình cho thấy một giản đồ SAO đơn giản để bán hàng trong một công ty sản xuất. Bảng thông tin bán hàng bao gồm số lượng, giá cả và các chỉ số liên quan khác. SALESREP, CUSTOMER, PRODUCT và TIME là các bảng dimension.
Lược đồ STAR cho bán hàng, như được hiển thị ở trên, chỉ chứa năm bảng, trong khi phiên bản chuẩn hóa hiện mở rộng đến mười một bảng. Chúng ta sẽ nhận thấy rằng trong Snowflake Schema, các thuộc tính có số lượng thấp trong mỗi bảng kích thước ban đầu sẽ bị loại bỏ để tạo thành các bảng riêng biệt. Các bảng mới này được kết nối trở lại bảng kích thước ban đầu thông qua các khóa nhân tạo.
Snowflake Schema được thiết kế để truy vấn linh hoạt trên các dimension và mối quan hệ phức tạp hơn. Nó phù hợp với nhiều đến nhiều và một đến nhiều mối quan hệ giữa các mức dimension.
Lợi thế của giản đồ Snowflake
- Ưu điểm chính của Snowflake Schema là sự phát triển về hiệu suất truy vấn do các yêu cầu lưu trữ đĩa được giảm thiểu và tham gia các bảng tra cứu nhỏ hơn.
- Nó cung cấp khả năng mở rộng lớn hơn trong mối quan hệ qua lại giữa các mức dimension và các thành phần.
- Không dư thừa nên dễ bảo trì hơn.
Nhược điểm của Snowflake Schema
Nhược điểm chính của Snowflake Schema là cần phải có thêm các nỗ lực bảo trì do số lượng bảng tra cứu ngày càng tăng. Nó còn được gọi là giản đồ sao đa sự thật.
Có nhiều truy vấn phức tạp hơn và do đó, khó hiểu.
Nhiều bảng hơn tham gia nên thời gian thực hiện truy vấn nhiều hơn.
Chúng tôi chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/ Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn như: Nakagawa, Mutoshi, Tinh Vân Group,….. đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.