warehouse là gì ? là một trong những từ khóa được search nhiều nhất về chủ đề warehouse là gì. Trong bài viết này, lamweb.vn sẽ viết bài viết Warehouse là gì ? Tổng quan về Warehouse

Kinh tế chông gai, đối thủ càng nhiều thì việc phân tích dữ liệu càng trở nên cần thiết đối với doanh nghiệp nhằm support ra quyết định, tăng trưởng lợi thế cạnh tranh. tuy nhiên Database thông thường lại k thoả mãn các yêu cầu về đánh giá dữ liệu, Database thông thường chỉ hỗ trợ tốt các nghiệp vụ hàng ngày và điểm mạnh nhất của nó là bảo đảm vẹn toàn dữ liệu, xử lý giao dịch, truy cập đồng thời. Database thông thường đó được gọi là Database nghiệp vụ (Operational Database) hoặc nền tảng giải quyết giao dịch thời gian thực (online transaction processing – OLTP). Thông thường các Database nghiệp vụ chỉ lưu trữ dữ liệu chi tiết cho thời điểm hiện nay, k lưu dữ liệu lịch sử, dữ liệu trong Database được thiết kế chuẩn hoá rất cao nên thường có hiệu năng kém khi truy vấn khó khăn (join nhiều bảng dữ liệu với nhau) hoặc khối lượng dữ liệu lớn. hơn nữa, việc truy vấn dữ liệu từ nhiều gốc không giống nhau là hầu như không thể nếu chỉ sử dụng Database nghiệp vụ.

Đang xem: Data warehousing là gì, Định nghĩa, ví dụ, giải thích warehouse là gì

*

Data Warehouse là gì?

Theo Wikipedia, Data Warehouse là kho dữ liệu tập trung chuyên dùng cho tạo báo cáo và nghiên cứu dữ liệu. Data Warehouse hỗ trợ các truy vấn khó khăn, vừa là điểm tụ họp dữ liệu từ nhiều gốc không giống nhau để có được thông tin đánh giá đa số nhất. Theo đó Data Warehouse là một tập hợp dữ liệu hướng chủ đề, toàn vẹn, k bị rò rỉ mất mát và có trị giá lịch sử. Cụ thể các thuộc tính đó như sau:

Tính hướng đề tài (Subject – oriented) nghĩa là Data Warehouse tụ họp vào việc phân tích các yêu cầu cai quản ở nhiều mức độ khác nhau trong quy trình ra quyết định. Các yêu cầu phân tích này thường rất cụ thể, và gói gọn loại ảnh mua bán của doanh nghiệp, gợi ý các doanh nghiệp cung cấp sẽ quan tâm đến tình hình mua bán, doanh nghiệp viễn thông quan tâm đến lưu lượng dịch vụ… không những thế một công ty thường chú ý đến vài đề tài không giống nhau, giống như doanh nghiệp phân phối còn phải quan tâm đến kho bãi, chuỗi cung ứng…Tính vẹn toàn (Integrated). Data Warehouse khắc phục các khó khăn trong việc kết hợp dữ liệu từ nhiều gốc dữ liệu khác nhau, khắc phục các sai không giống về tên trường dữ liệu (dữ liệu không giống nhau nhưng tên giống nhau), ý nghĩa dữ liệu (tên giống nhau nhưng dữ liệu khác nhau), định hướng dữ liệu (tên và ý nghĩa giống nhau nhưng kiểu dữ liệu không giống nhau).Tính bất biến (Nonvolatile) quy định rằng dữ liệu phải thống nhất theo thời gian (bằng mẹo giới hạn tối đa sửa đổi hoặc xoá dữ liệu), từ đó sử dụng tăng trưởng quy mô dữ liệu lên đáng kể đối với nền móng nghiệp vụ (5-10 năm so với 2 đến 6 tháng như Database thông thường).giá trị lịch sử (time – varying). Data Warehouse có khả năng lấy các trị giá không giống nhau của cùng một thông tin và thời điểm xảy ra thay đổi. gợi ý thông tin địa chỉ, email, sđt của khách hàng đủ sức refresh, nhưng việc cải thiện đó k được phép ảnh hưởng đến giá trị báo cáo, nghiên cứu thực hiện trước khi sự thay đổi xảy ra.

Data Warehouse cho phép user ở mức thống trị ra quyết định thực hiện các phép phân tích tương tác với data bằng nền móng giải quyết nghiên cứu online (online analytical processing – OLAP). ngoài ra Data Warehouse được sử dụng cho báo cáo, data mining và phân tích tổng hợp. Database và Data Warehouse, thành ra chỉ không giống nhau về mặt khái niệm, một Database nếu sử dụng riêng cho các mục đích trên cũng được coi là Data Warehouse.

giống như vậy, nếu giống như Database được ví như cái tủ sách cá nhân, ngành người xem liên tục kiểm tra, cập nhật, hiệu đính, ghi chú vào lề, thêm mới hoặc chuyển sách đi, thì Data Warehouse lại được so sánh với thư viện quốc gia, nơi các ebook kinh điển được mang đến tiếp tục để lưu trữ và đọc qua, không ai sửa chữa hoặc chuyển chúng qua chỗ nào khác cả.

Data Warehouse có khả năng lưu trữ tới hàng trăm GB hay thậm chí hàng Terabyte. Data Warehouse được thiết lập để tiện dụng cho việc truy cập theo nhiều nguồn, nhiều kiểu dữ liệu không giống nhau sao cho đủ nội lực hòa hợp được cả những vận dụng của các công nghệ hiện đại và kế thừa được từ những nền tảng vừa mới có sẵn từ trước.

Xem thêm: Luận Đoán Tài Vận Là Gì ? Cách Tự Mở Cung Tài Lộc Rước Tiền Tài Vào Nhà

đủ sức bạn quan tâm:

So sánh báo cáo quản trị giỏi (BI) và báo cáo Excel truyền thốngBI (Business Intelligence) là gì mà doanh nghiệp nào cũng cần?hệ thống báo cáo quản trị – software tổng hợp đài truyền ảnh Việt Nam

Kiến trúc của Data Warehouse

*

Data Warehouse có kiến trúc cơ bản rất không khó khăn. Nó dựa trên nguyên tắc là xây dựng một kho dữ liệu thống nhất từ nhiều gốc dữ liệu khác nhau để giúp cho truy vấn gồm 3 lớp chính:

Lớp dữ liệu nguồn (Data Sources): Data Warehouse thống kê dữ liệu từ rất nhiều nguồn khác nhau. Điều này thể hiện đặc tính tích hợp của Data Warehouse. Dữ liệu gốc đủ sức là dữ liệu có sẵn trong nền móng tác nghiệp của công ty và cũng đủ nội lực là dữ liệu quét từ gốc bên ngoài công ty. Dữ liệu có thể là loại có cấu trúc chặt chẽ giống như dữ liệu gắn kết đang được chuẩn hoá hay đủ sức là loại phi cấu trúc giống như các văn bản thông thường.Lớp Warehouse: Lớp này chứa đựng dữ liệu vừa mới được tổng hợp cùng siêu dữ liệu mô tả chúng cũng giống như các tiến trình đo đạt, phân bổ dữ liệu. Hai thành phần cần thiết nhất của lớp Warehouse là dữ liệu và siêu dữ liệu. Chúng phải được lưu giữ và giới thiệu nhất quán về content (ý nghĩa dữ liệu) cũng giống như thể loại (khuôn dạng dữ liệu). Để gia tăng tốc cho việc đáp ứng trả lời truy vấn thì dữ liệu trong Data Warehouse thường được để sẵn dưới dạng tổng kết.Lớp Users: có Nhiệm vụ tương tác với user cuối. Data Warehouse có đặc điểm cần thiết là cung cấp thông tin cho rất nhiều người sử dụng với những yêu cầu không thể dự đoán trước, cho nên Nhìn chung lớp user có cấu trúc phức tạp. thêm nữa, người dùng ở đây đủ nội lực dùng nhiều tool khai thác và truy xuất dữ liệu khác nhau nên giao diện giữa lớp Warehouse và người dùng cũng thông dụng.

Do tính phổ biến của lớp vận dụng và lớp user nên chúng k thể giao tiếp với Data Warehouse theo các giao diện hợp lý mà thường cần phải có những công cụ được design đặc biệt chuyên thực hiện công việc này. Dữ liệu khi được đưa vào hoặc mang ra đòi hỏi phải có những tiến trình xử lý phức tạp. Các vận dụng đảm nhiệm công việc này thường tạo ra các kho trung gian và phải thực thi nhiều bước chuyển tiếp.

Có hai tiến trình xử lý gồm:

tụ họp dữ liệu đưa vào Warehouse: ngoài việc đọc hiểu các cấu trúc dữ liệu, công cuộc này còn phải thực hiện nhiều chức năng không giống để bảo đảm tính nhất quán của dữ liệu trong Warehouse.Phân bổ dữ liệu đến user cuối: có nhiều công cụ để thực hiện việc này, nhưng nói chung dữ liệu thường được xử lý trước rồi mới hiển thị tới người dùng cuối.

Xem thêm: ' Tmi Là Gì Trong Trò Chuyện Qua Internet? Tmi (Quá Nhiều Thông Tin) Là Gì

giống như vậy có thể thấy, Data Warehouse là thành phần cơ bản, đóng vai trò then chốt trong việc tập kết, giải quyết dữ liệu thô trong doanh nghiệp. Do lượng thông tin trong một công ty đủ sức đến từ nhiều gốc khác nhau, kéo đến việc dữ liệu không đồng nhất, không những thế khối lượng dữ liệu sẽ gia tăng mau theo thời gian. Điều này dẫn đến quá đăng và giảm đáng kể cấp độ truy xuất nếu tổ chức chỉ dụng một database duy nhất. thiết lập Data Warehouse là công đoạn trước nhất và cơ bản trong quá trình tích hợp hệ thống báo cáo quản trị giỏi cho doanh nghiệp. Từ đó nền tảng báo cáo có thể truy xuất, giải quyết dữ liệu một phương pháp nhanh chóng và không khó khăn.

Leave a Reply

Your email address will not be published. Required fields are marked *