Hướng dẫn SSAS: SSAS Cube là gì, Archikiến trúc & các loại
SSAS là gì?
Dịch vụ phân tích máy chủ SQL (SSAS) là một máy chủ OLAP đa chiều cũng như một công cụ phân tích cho phép bạn chia nhỏ khối lượng dữ liệu lớn. Nó là một phần của Microsoft SQL Server và giúp thực hiện phân tích bằng nhiều kích thước khác nhau. Nó có 2 biến thể Đa chiều và Dạng bảng. Dạng đầy đủ của SSAS là Dịch vụ phân tích máy chủ SQL.
Archicấu trúc của SSAS
Đầu tiên trong hướng dẫn SSAS này, chúng ta sẽ tìm hiểu về kiến trúc SSAS:
Quan điểm kiến trúc của các dịch vụ phân tích máy chủ SQL dựa trên kiến trúc ba tầng, bao gồm
- RDBMS: Dữ liệu từ các nguồn khác nhau như Excel, Cơ sở dữ liệu, Văn bản, các nguồn khác có thể được lấy với sự trợ giúp của Công cụ ETL vào RDBMS.
- SSAS: Dữ liệu tổng hợp từ RDBMS được đẩy vào các khối SSAS bằng cách sử dụng các dự án dịch vụ phân tích. Các khối SSAS sẽ tạo cơ sở dữ liệu phân tích và khi cơ sở dữ liệu phân tích đã sẵn sàng, nó có thể được sử dụng cho nhiều mục đích.
- Khách hàng: Khách hàng có thể truy cập dữ liệu bằng Bảng điều khiển, Thẻ điểm, Cổng thông tin, v.v.
Lịch sử của SSAS
Bây giờ trong hướng dẫn SSAS này, chúng ta sẽ tìm hiểu lịch sử của SSAS:
- Tính năng MSOLAP lần đầu tiên được đưa vào SQL Server 7.0. Công nghệ này sau đó được mua từ một công ty Israel có tên là Panorama.
- Chẳng bao lâu nó sẽ trở thành công cụ OLAP được sử dụng nhiều nhất vì nó được đưa vào như một phần của SQL Server.
- SSAS đã được cải tạo hoàn toàn với việc phát hành Máy chủ MS-SQL 2005
- Phiên bản mới nhất này cũng cung cấp tính năng dành cho “các khối con” với câu lệnh Phạm vi. Điều này đã làm tăng chức năng của các khối SSAS.
- Phiên bản SSAS 2008R2 và 2012 chủ yếu liên quan đến hiệu suất truy vấn và khả năng mở rộng
- In Microsoft excel 2010 có một phần bổ trợ có tên PowerPivot sử dụng phiên bản cục bộ của dịch vụ Phân tích với công cụ XVelocity mới giúp tăng hiệu suất truy vấn
Thuật ngữ SSAS quan trọng
Bây giờ trong hướng dẫn về mô hình bảng SSAS này, chúng ta sẽ tìm hiểu một số thuật ngữ quan trọng của SSAS:
- Nguồn dữ liệu
- Chế độ xem nguồn dữ liệu
- Cube
- Bảng kích thước
- kích thước
- Cấp
- Bảng dữ kiện
- Đo
- Schema
Nguồn dữ liệu
Nguồn dữ liệu là một loại chuỗi kết nối. Nó thiết lập một kết nối giữa cơ sở dữ liệu phân tích và RDBMS.
Chế độ xem nguồn dữ liệu
Chế độ xem nguồn dữ liệu là mô hình logic của Cơ sở dữ liệu
Cube
Khối lập phương là đơn vị lưu trữ cơ bản. Nó là tập hợp dữ liệu được tổng hợp để cho phép các truy vấn trả về dữ liệu một cách nhanh chóng.
MOLAP
MOLAP được tạo thành từ khối dữ liệu chứa các phép đo và chiều. Nó bao gồm tất cả các thành viên có thể có mối quan hệ phân cấp.
Đây là bộ quy tắc cụ thể giúp bạn xác định cách tính toán các ô nhất định trong khối lập phương thưa thớt và đo lường các giá trị được cuộn bên trong hệ thống phân cấp đó.
Bảng kích thước
- Bảng thứ nguyên chứa các thứ nguyên của một thực tế.
- Chúng được nối vào bảng thực tế bằng khóa ngoại.
- Bảng thứ nguyên là các bảng không chuẩn hóa.
- Các kích thước cung cấp các đặc điểm của sự kiện với sự trợ giúp của các thuộc tính của chúng.
- Không cung cấp giới hạn được đặt cho một số thứ nguyên nhất định
- Kích thước này chứa một hoặc nhiều mối quan hệ phân cấp.
kích thước
Thứ nguyên cung cấp bối cảnh xung quanh một sự kiện quy trình kinh doanh. Nói một cách đơn giản, họ cung cấp thông tin thực tế cho ai, cái gì, ở đâu. Trong quy trình kinh doanh Bán hàng, đối với số lượng bán hàng thực tế, thứ nguyên sẽ là Tên khách hàng.
- Ở đâu – Vị trí
- Cái gì – Tên sản phẩm
- Nói cách khác, bạn có thể nói rằng một chiều là một cửa sổ để xem thông tin thực tế.
Cấp
Mỗi loại tóm tắt có thể được lấy từ một chiều được gọi là nhãn.
Bảng dữ kiện
Bảng dữ kiện là bảng quan trọng nhất trong mô hình chiều. Bảng sự kiện chứa Số đo/sự kiện và Khóa ngoại vào bảng chiều. Ví dụ, hoạt động trả lương.
Đo
Mỗi bảng thực tế chứa một hoặc nhiều bảng cần được phân tích. Ví dụ, một cuốn sách bán bảng thông tin. Đó có thể là lãi hoặc lỗ tùy theo số lượng sách bán ra.
Schema
cơ sở dữ liệu lược đồ của hệ thống cơ sở dữ liệu và cấu trúc của nó được mô tả bằng ngôn ngữ hình thức. Nó hỗ trợ hệ thống quản lý cơ sở dữ liệu. Thuật ngữ “lược đồ” có nghĩa là việc tổ chức dữ liệu như một bản thiết kế chi tiết về cách xây dựng cơ sở dữ liệu.
Loại mô hình trong SSAS
Bây giờ, chúng ta sẽ tìm hiểu các loại mô hình trong SSAS trong hướng dẫn về khối SSAS này:
Mô hình dữ liệu đa chiều
Mô hình dữ liệu đa chiều, bao gồm một khối dữ liệu. Đây là một nhóm các thao tác cho phép bạn truy vấn giá trị của các ô bằng cách sử dụng các thành phần khối và kích thước làm tọa độ.
Nó xác định các quy tắc quyết định cách các giá trị đo lường được cuộn lại trong các hệ thống phân cấp hoặc cách các giá trị cụ thể được tính toán trong một khối lập phương thưa thớt.
Mô hình dạng bảng
Mô hình hóa dạng bảng tổ chức dữ liệu vào các bảng có liên quan. Bảng không được chỉ định là “thứ nguyên” hay “sự kiện” và thời gian phát triển sẽ ít hơn với bảng dạng bảng vì tất cả các bảng liên quan đều có thể phục vụ cả hai vai trò.
Mô hình dạng bảng và mô hình đa chiều
| Thông số Kỹ thuật | Bảng | Đa chiều |
|---|---|---|
| Bộ nhớ | Trong bộ nhớ đệm | Lưu trữ dựa trên tập tin |
| Structure | Cấu trúc lỏng lẻo | Cấu trúc cứng rắn |
| Tính năng tốt nhất | Dữ liệu không cần phải di chuyển từ nguồn | Tốt nhất là khi dữ liệu được đưa vào lược đồ hình sao. |
| Loại mô hình | mô hình quan hệ | Mô hình chiều |
| DAX | MDX | |
| phức tạp | Đơn giản | Phức tạp |
| Kích thước máy | Nhỏ hơn | Lớn hơn |
Các tính năng chính của SSAS
Các tính năng cơ bản của SSAS là:
- Nó cung cấp khả năng tương thích ngược ở cấp độ API.
- Bạn có thể sử dụng OLEDB cho OLAP cho API truy cập máy khách và MDX làm ngôn ngữ truy vấn.
- SSAS giúp bạn xây dựng kiến trúc MOLAP, HOLAP và ROLAP
- Nó cho phép bạn làm việc ở chế độ máy khách-máy chủ hoặc chế độ ngoại tuyến.
- Bạn có thể sử dụng công cụ SSAS với các trình hướng dẫn và nhà thiết kế khác nhau.
- Việc tạo và quản lý mô hình dữ liệu rất linh hoạt.
- Tùy chỉnh ứng dụng từ sự hỗ trợ rộng rãi
- Cung cấp Cấu trúc động, Báo cáo đặc biệt, Siêu dữ liệu được chia sẻ và các tính năng Bảo mật
SSAS so với PowerPivot
| Tham số | SSAS | powerpivot |
|---|---|---|
| Là gì | SSAS đa chiều là “BI doanh nghiệp” | Microsoft PowerPivot là “BI tự phục vụ |
| Triển khai | Triển khai tới SSAS | Nó được triển khai lên SharePoint |
| Dùng cho | Dự án Visual Studio | Excel |
| Kích thước máy | Kích thước giới hạn trong bộ nhớ | Dung lượng giới hạn ở mức 2 GB. |
| Hỗ trợ phân vùng | Hỗ trợ phân vùng | Không có phân vùng |
| loại truy vấn | DirectQuery và Vertipaq |
Chỉ cho phép Vertipaq Truy vấn |
| Công cụ quản trị | Công cụ quản trị máy chủ (ví dụ: SSMS] | “Quản trị viên” Excel và SharePoint |
| Bảo mật | Bảo mật cấp hàng và động | Bảo mật tập tin sổ làm việc |
Ưu điểm của SSAS
Ưu điểm/lợi ích của SSAS là:
- Giúp bạn tránh tranh chấp tài nguyên với hệ thống nguồn
- Nó là một công cụ lý tưởng để phân tích số.
- SSAS cho phép khám phá các mẫu dữ liệu có thể không rõ ràng ngay lập tức bằng cách sử dụng các tính năng khai thác dữ liệu được tích hợp trong sản phẩm.
- Nó cung cấp chế độ xem thống nhất và tích hợp cho tất cả dữ liệu kinh doanh của bạn. Báo cáo, phân tích thẻ điểm Chỉ số hiệu suất chính (KPI) Khai thác dữ liệu.
- SSAS cung cấp xử lý phân tích trực tuyến (OLAP) dữ liệu từ các nguồn dữ liệu khác nhau.
- Nó cho phép người dùng phân tích dữ liệu bằng một loạt công cụ, bao gồm SSRS và Excel.
Nhược điểm của việc sử dụng SSAS
- Khi bạn chọn một đường dẫn (Dạng bảng hoặc Đa chiều), bạn không thể di chuyển sang phiên bản khác mà không bắt đầu lại
- Bạn không được phép “hợp nhất” dữ liệu giữa các khối dạng bảng và đa chiều
- Tabular tỏ ra nguy hiểm nếu yêu cầu thay đổi giữa chừng của dự án
Cách thực hành tốt nhất khi sử dụng SSAS
- Tối ưu hóa thiết kế nhóm khối và thước đo
- Bạn nên xác định các Tập hợp hữu ích
- Sử dụng phương pháp phân vùng
- Viết MDX hiệu quả
- Sử dụng bộ nhớ đệm của công cụ truy vấn một cách hiệu quả
- Mở rộng quy mô khi bạn không thể mở rộng quy mô nữa

