Contents
Kinh Nghiệm Hướng dẫn Bảng Fact là gì 2022 2022
You đang tìm kiếm từ khóa Bảng Fact là gì 2022 được Update vào lúc : 2022-02-13 22:44:00 . Với phương châm chia sẻ Bí quyết về trong nội dung bài viết một cách Chi Tiết Mới Nhất. Nếu sau khi đọc nội dung bài viết vẫn ko hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Admin lý giải và hướng dẫn lại nha.
Quý khách đang tìm kiếm từ khóa Bảng Fact là gì được Cập Nhật vào lúc : 2022-02-13 22:44:04 . Với phương châm chia sẻ Bí quyết về trong nội dung nội dung bài viết một cách Chi Tiết 2022. Nếu sau khi Read nội dung nội dung bài viết vẫn ko hiểu thì hoàn toàn hoàn toàn có thể lại phản hồi ở cuối bài để Ad lý giải và hướng dẫn lại nha.
Data Warehouses và Data Marts
Sơ đồ ngôi sao 5 cánh 5 cánh (Star Schema)
Ví dụ sơ đồ ngôi sao 5 cánh 5 cánh (Star schema): Sales
Ví dụ quy mô ngôi sao 5 cánh 5 cánh: Supply Orders
Điểm mạnh và yếu của quy mô ngôi sao 5 cánh 5 cánh.
Mô hình thiên hà (Galaxy Schema)
Ngày nay, những báo cáo và phân tích quan trọng như thể trách nhiệm chính vậy. Các bản báo cáo hoàn toàn hoàn toàn có thể được xây dựng lên từ tài liệu trực tuyến; thường thì kiểu tiếp cận này sẽ hay dùng trong công ty vừa và nhỏ mà không hề nhiều tài liệu. Nhưng khi mọi thứ lớn lên hoặc lượng tài liệu khởi đầu tăng thêm nhanh gọn, đến lúc phải nghĩ đến yếu tố chia tách tài liệu khối mạng lưới khối mạng lưới hệ thống hoạt động và sinh hoạt giải trí và sinh hoạt vui chơi (operational systems) và khối mạng lưới khối mạng lưới hệ thống báo cáo (reporting system).
Trước khi xử lý và xử lý quy mô tài liệu, toàn bộ toàn bộ chúng ta cần vài hiểu biết nền tảng về khối mạng lưới khối mạng lưới hệ thống. Chúng ta cần chia những khối mạng lưới khối mạng lưới hệ thống ra thành 2 khuôn khổ: khối mạng lưới khối mạng lưới hệ thống hoạt động và sinh hoạt giải trí và sinh hoạt vui chơi (operational system) và khối mạng lưới khối mạng lưới hệ thống báo cáo (reporting system). Hệ thống hoạt động và sinh hoạt giải trí và sinh hoạt vui chơi thường gọi là OLTP. Các bạn hoàn toàn hoàn toàn có thể đọc bài Sự rất rất khác nhau giữa OLTP và OLAP. Hệ thống báo cáo và phân tích được nghe biết là OLAP. OLTP tương hỗ xử lý thanh toán thanh toán trong trách nhiệm marketing thương mại. Chúng thao tác với tài liệu live và cần độ chuẩn hoá cao vì nó nên phải tương tác với những người dân tiêu dùng vận tốc nhanh. trái lại, tiềm năng chính của OLAP là phân tích. Các khối mạng lưới khối mạng lưới hệ thống này sử dụng để tổng hợp tài liệu, thường được thiết kế theo cấu trúc phi đúng cho kho tài liệu giống sơ đồ ngôi sao 5 cánh 5 cánh. (Phi chuẩn là gì? Đơn giản là giảm dư thừa tài liệu cho vận tốc nhanh hơn)
Giờ toàn bộ toàn bộ chúng ta đã biết một chút ít ít về những khối mạng lưới khối mạng lưới hệ thống, hãy khởi đầu nào:
Data Warehouses và Data Marts
Một data warehouse (kho tài liệu DWH) là một khối mạng lưới khối mạng lưới hệ thống được sử dụng để tàng trữ thông tin cho việc phân tích và báo cáo. Data Marts là một tập con của data warehouses được sử dụng để tàng trữ thông tin thiết yếu cho một phòng ban hoặc trong cả một người tiêu dùng đơn lẻ. (Tưởng tượng DWH là một toà nhà, data marts là một văn phòng trong toà nhà).
Tại sao lại cần data marts? Tất cả những tài liệu liên quan được tàng trữ trong công ty DWH. Đối với hầu hết người tiêu dùng, họ chỉ việc truy vấn vào một trong những trong những tập con tài liệu rõ ràng, in như bán hàng (sales), sản xuất (production), luân chuyển (logistic) hoặc marketing. Data marts quan trọng ở cả hai mặt là bảo mật thông tin thông tin tài liệu và tránh nhầm lẫn vì quá nhiều tài liệu (toàn bộ toàn bộ chúng ta không thích nhầm lẫn chúng hoặc thao tác với những tài liệu không liên quan).
Có 2 cách tiếp cận để xây dựng data warehouse và data mart:
- Top–Down: Data mart được tạo từ data warehouse có trước.
Bottom–Up: Data marts được tạo thứ nhất, tiếp Từ đó phối hợp chúng lại thành data warehouse.
Quá trình ETL được sử dụng để thêm tài liệu vào khối mạng lưới khối mạng lưới hệ thống OLAP. ETL là viết tắt cảu Extract, Transform và Load. Như tên của nó, toàn bộ toàn bộ chúng ta trích xuất (extract) tài liệu từ một hoặc nhiều nguồn là những cơ sở tài liệu hoạt động và sinh hoạt giải trí và sinh hoạt vui chơi (OLTP), tiếp Từ đó chuyển nó (transform) cho phù phù thích phù thích hợp với cấu trúc của datawarehouse, và load nó vào DWH.
Mô hình chiều tài liệu (Dimensional modeling) là một phần của thiết kế data warehouse, kết của trong việc tạo quy mô chiều. Có 2 loại bảng tham gia vào:
- Các bảng dimension được sử dụng để mô tả tài liệu mà toàn bộ toàn bộ chúng ta muốn tàng trữ. Ví dụ: một nhà bán lẻ muốn tàng trữ thời hạn, shop, và nhân viên cấp dưới cấp dưới tham gia vào một trong những trong những hoá đơn. Mỗi một bảng dimension là một khuôn khổ của nó (ngày tháng, nhân viên cấp dưới cấp dưới, shop) và hoàn toàn hoàn toàn có thể có một hoặc nhiều thuộc tính (attributes). Với mỗi một shop, toàn bộ toàn bộ chúng ta lưu chúng những thông tin như vị trí trong thành phố, vùng miền, tỉnh thành và vương quốc. Mỗi một ngày tháng toàn bộ toàn bộ chúng ta lưu năm, tháng, ngày trong tháng, ngày trong tuầnĐiều này liên quan đến việc phân cấp của những thuộc tính trong bảng dimension.
Trong sơ đồ ngôi sao 5 cánh 5 cánh, toàn bộ toàn bộ chúng ta sẽ thường tìm một vài thuộc tính là tập con của những thuộc tính khác trong cùng 1 bản ghi. Sự dư thừa này nên rất thận trọng và giúp tăng hiệu năng tốt hơn. Chúng ta hoàn toàn hoàn toàn có thể dùng ngày tháng, vị trí, và chi nhánh bán hàng để tổng hợp (đó đó là transform trong ETL) và tàng trữ tài liệu trong DWH. Trong quy mô dimension, nó rất quan trọng trong việc định nghĩa dimension đúng và thích hợp.
- Bảng Fact chứa tài liệu mà toàn bộ toàn bộ chúng ta muốn thêm vào reports, tổng hợp trên những giá trị trong những bảng dimension. Một bảng fact chỉ có những cột lưu giá trị và những cột khoá ngoại tham chiếu đến bảng dimensions. Kết hợp toàn bộ những khoá ngoại và khoá chính trong bảng fact. Ví dụ, một bảng fact hoàn toàn hoàn toàn có thể tàng trữ một số trong những trong những lượng những hợp đồng và số lượng những nhân viên cấp dưới cấp dưới bán hàng từ những list hợp đồng.
Với những thông tin này toàn bộ toàn bộ chúng ta hoàn toàn hoàn toàn có thể hiểu và xây dựng được sơ đồ ngôi sao 5 cánh 5 cánh.
Sơ đồ ngôi sao 5 cánh 5 cánh (Star Schema)
Sơ đồ ngôi sao 5 cánh 5 cánh là quy mô đơn thuần và giản dị nhất được sử dụng trong DWH. Bởi vì bảng fact là TT của quy mô với những bảng dimension xung quanh nó, nó nhìn in như một ngôi sao 5 cánh 5 cánh. Điều này rất rõ ràng ràng ràng khi bảng fact được xung quanh bởi 5 bảng dimension. Một biến thể của sơ đồ ngôi sao 5 cánh 5 cánh là sơ đồ con rết (centipede schema), nơi mà bảng fact được xung quanh bởi số lượng lớn những bảng dimension nhỏ.
Mô hình ngôi sao 5 cánh 5 cánh được sử dụng rộng tự do trong data marts. Chúng ta hoàn toàn hoàn toàn có thể phối hợp chung trong quy mô top-down. Chúng ta sẽ phân tích quy mô 2 ngôi sao 5 cánh 5 cánh và phối hợp chúng để tạo ra quy mô đơn thuần và giản dị.
Ví dụ sơ đồ ngôi sao 5 cánh 5 cánh (Star schema): Sales
Báo cáo bán hàng (sales reports) là một trong những báo cáo phổ biết nhất lúc bấy giờ. Như toàn bộ toàn bộ chúng ta đã nhắc tới ở phía trên, hầu hết những trường hợp toàn bộ toàn bộ chúng ta tạo ra báo cáo bán hàng từ khối mạng lưới khối mạng lưới hệ thống live. Nhưng khi kích thước tài liệu hoặc trách nhiệm làm cho chúng trở nên rườm rà, toàn bộ toàn bộ chúng ta sẽ phải xây dựng một data warehouse hoặc một data mart để sắp xếp lại quy trình. Sau khi thiết kế quy mô ngôi sao 5 cánh 5 cánh, một quy trình ETL sẽ lấy tài liệu từ cơ sở tài liệu hoạt động và sinh hoạt giải trí và sinh hoạt vui chơi (OLTP), chuyển tài liệu theo định dạng của DWH và bơm vào data warehouse.
Mô hình trình diễn ở trên chứa một bảng fact (red color) và 5 bảng dimension (màu xanh). Các bảng này là:
- fact_salesBảng này chứa tham chiếu đến những bảng dimensions và thêm 2 thông tin chính (giá và số lượng bán). Chú ý là toàn bộ 5 khoá ngoại kết phù thích phù thích hợp với khoá chính của bảng.
dim_sales_typeBảng này là loại sales có duy nhất 1 thuộc tính type_name.
dim_employee Đây là bảng nhân viên cấp dưới cấp dưới, lưu thông tin cơ bản của nhân viên cấp dưới cấp dưới: họ tên và năm sinh.
dim_productBảng này lưu list thành phầm với 2 thuộc tính (tên và loại thành phầm).
dim_time Bảng này sở hữu thời hạn. Nó gồm có 5 thuộc tính ngoài khoá chính. Mức thấp nhất là ngày (action_date). Thuộc tính action_weeklà số tuần trong năm (Ví dụ tuần đầu trong tháng 1 sẽ là một trong; tuần cuối của tháng 12 sẽ là 52, etc.) Thuộc tính actual_monthvà thuộc tínhactual_year tàng trữ tháng và năm bán hàng. Các hông tin này được lấy ra từ thuộc tínhaction_date. Thuộc tínhaction_weekdaylưu trữ tên của ngày bán hàng.
dim_storeMỗi một shop sẽ lưu thành phố, vùng, tỉnh và vương quốc nơi mà nó đặt. Chúng ta hoàn toàn hoàn toàn có thể rõ ràng là quy mô ngôi sao 5 cánh 5 cánh được phi chuẩn.
Ví dụ quy mô ngôi sao 5 cánh 5 cánh: Supply Orders
Có nhiều sự tương tự với quy mô sales ở trên:
Mô hình này triệu tập tàng trữ lịch sử của hoá đơn. Chúng ta có một bảng fact và 4 bảng dimension. Các bảng dimension:dim_employee,dim_productvàdim_timetrích xuất thông tin in như quy mô sales. Tuy nhiên những bảng dươi đây lại khác:
- fact_supply_order chứa tài liệu tổng hợp về hoá đơn.
dim_supplier là bảng chứa list nhà phục vụ giống dim_storelưu trữ thông tin shop trong quy mô sales.
Điểm mạnh và yếu của quy mô ngôi sao 5 cánh 5 cánh.
Có nhiều lợi thế mẽ và tự tin của quy mô ngôi sao 5 cánh 5 cánh. Bảng fact liên quan đến mỗi bảng dimension bởi một quan hệ, và toàn bộ toàn bộ chúng ta không cần bất Tính từ lúc điểm tương hỗ update nào để mô tả những bảng dimension. Đơn giản là truy vấn và giảm thời hạn thực thi. Chúng ta hoàn toàn hoàn toàn có thể tái hiện báo cáo trực tiếp từ khối mạng lưới khối mạng lưới hệ thống OLTP, nhúng câu lệnh sẽ phức tạp hơn và hoàn toàn hoàn toàn có thể ảnh hưởng đến hiệu năng chung của khối mạng lưới khối mạng lưới hệ thống. Ví dụ sau này là câu truy vấn cho quy mô sales sẽ trả về số lượng của toàn bộ nhiều chủng loại điện thợi được bán ở những shop đặt tại Berlin trong năm 2022:
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) AS quantity_sold
FROM
fact_sales
INNER JOIN dim_product ON fact_sales.product_id = dim_product.product_id
INNER JOIN dim_time ON fact_sales.time_id = dim_time.time_id
INNER JOIN dim_store ON fact_sales.store_id = dim_store.store_id
WHERE
dim_time.action_year = 2022
AND dim_store.city = ‘Berlin’
AND dim_product.product_type=”phone”
GROUP BY
dim_store.store_id,
dim_store.store_address
Điểm yếu nhất của quy mô ngôi sau là dư thừa. Mỗi bảng dimension lưu trũ tách rời, và đấy là nguyên nhân của không chuẩn hoá. Trong ví dụ của toàn bộ toàn bộ chúng ta, thành phố thuộc về một vùng hoặc một tỉnh thành, chúng cũng thuộc về một giang sơn; toàn bộ toàn bộ chúng ta không tàng trữ quan hệ như thể một quy tắc của cơ sở tài liệu, nhưng toàn bộ toàn bộ chúng ta cứ lặp lại nó. Nghĩa là toàn bộ toàn bộ chúng ta sẽ tốn nhiều dung tích ổ đĩa và có rủi ro không mong muốn không mong ước về toàn vẹn tài liệu.
Mô hình thiên hà (Galaxy Schema)
Chúng ta hoàn toàn hoàn toàn có thể nhìn vào 2 quy mô trên như thể 2 data mart, 1 là cho phòng bán hàng (sales) 2 là cho bộ phận nhà phục vụ (supply). Mỗi cái đó gồm có chỉ một bảng fact và một vài bảng dimension. Nếu toàn bộ toàn bộ chúng ta muốn phối hợp 2 data mart vào làm một. Đây là kiểu quy mô chứa vài bảng fact và chia sẻ những bảng dimension nó được gọi là quy mô galaxy (galaxy schema). Chia sẻ những bảng dimension hoàn toàn hoàn toàn có thể giảm kích thước của cơ sở tài liệu đặc biết là lúc chia sẻ những bảng dimension có nhiều giá trị. Ý tưởng là những bảng dimension trong cả hai data mart có chung 1 phương pháp. Nếu không toàn bộ toàn bộ chúng ta sẽ phải sửa đổi cho nó phù phù thích phù thích hợp với cả hai.
Một quy mô thiên hà (galaxy schema) được xây dựng lên với 2 ví dụ data mart, được hiển thị như hình:
Mô hình ngôi sao 5 cánh 5 cánh (star schema) là một cách tiếp cận để tổ chức triển khai triển khai data warehouse. Nó rất đơn thuần và giản dị và thường dùng trong data mart. Nếu bạn không phải lo về dung tích ổ đĩa và toàn bộ toàn bộ chúng ta làm tốt phần toàn vẹn tài liệu thì quy mô ngôi sao 5 cánh 5 cánh khả thi và là lựa chọn tốt. Nếu không thì những bạn nên nghĩ đến cách tiếp cận khác. Một trong số đó là quy mô bông tuyết (snowflake shema) toàn bộ toàn bộ chúng ta sẽ nói tới sau.
Trích nguồn từ: (vertabelo)
Reply
2
0
Chia sẻ
Bạn vừa đọc nội dung nội dung bài viết Với Một số hướng dẫn một cách rõ ràng hơn về Video Bảng Fact là gì tiên tiến và phát triển và tăng trưởng nhất và ShareLink Tải Bảng Fact là gì Free.
Hỏi đáp vướng mắc về Bảng Fact là gì
Nếu sau khi đọc nội dung nội dung bài viết Bảng Fact là gì vẫn chưa hiểu thì hoàn toàn hoàn toàn có thể lại phản hồi ở cuối bài để Admin lý giải và hướng dẫn lại nha
#Bảng #Fact #là #gì
Review Bảng Fact là gì 2022 ?
Bạn vừa tìm hiểu thêm Post Với Một số hướng dẫn một cách rõ ràng hơn về Review Bảng Fact là gì 2022 tiên tiến và phát triển nhất
Chia Sẻ Link Download Bảng Fact là gì 2022 miễn phí
Người Hùng đang tìm một số trong những Chia Sẻ Link Down Bảng Fact là gì 2022 Free.
Giải đáp vướng mắc về Bảng Fact là gì 2022
Nếu sau khi đọc nội dung bài viết Bảng Fact là gì 2022 vẫn chưa hiểu thì hoàn toàn có thể lại Comments ở cuối bài để Admin lý giải và hướng dẫn lại nha
#Bảng #Fact #là #gì