Cách tiếp cận truyền thống đối với quá trình chuyển đổi (Trích xuất, Tải, Chuyển đổi) yêu cầu người dùng kỹ thuật tham gia trực tiếp. Chúng thực hiện kết nối với các nguồn dữ liệu, chuyển đổi dữ liệu và cung cấp bộ dữ liệu cuối cùng cho người dùng doanh nghiệp.
Quá trình này thường đòi hỏi nhiều thời gian bất cứ khi nào người dùng doanh nghiệp yêu cầu thêm thông tin hoặc do những thay đổi / cập nhật trong logic nghiệp vụ. Sau đó, người dùng kỹ thuật phải hoàn nguyên tập dữ liệu và chuyển đổi.
Luồng dữ liệu trong Oracle Analytics là giải pháp cho người dùng doanh nghiệp cho phép họ tạo các phép biến đổi tuần tự cho tập dữ liệu của họ. Giao diện người dùng cung cấp một tập hợp các thành phần để thực hiện chuyển đổi mà không cần tập kỹ năng lập trình cho các mục tiêu sau:
- Kết hợp, biến đổi và tích hợp các tập dữ liệu
- Chuẩn bị các bộ dữ liệu được quản lý để phân tích thêm
- Gửi tập dữ liệu được quản lý tới cơ sở dữ liệu quan hệ hoặc Essbase
- Xây dựng đào tạo các mô hình học máy
Các bài viết hiện tại sẽ tập trung vào việc sử dụng Luồng dữ liệu để xây dựng Phân tích cảm xúc. Đây là một trong những trường hợp sử dụng phổ biến liên quan đến tập dữ liệu khách hàng để nhận xét, phản hồi, v.v.
Tổng quan về cách sử dụng
Giả sử rằng bạn có một nhiệm vụ khẩn cấp là phân tích dữ liệu Bán hàng cho các chi nhánh cụ thể.
Bạn đã yêu cầu nhóm CNTT trích xuất dữ liệu thành nhiều bộ dữ liệu. Bây giờ, bạn cần kết hợp tất cả các tập dữ liệu vào một chế độ xem duy nhất và xây dựng báo cáo mà không cần nỗ lực vào quá trình chuyển đổi.
Chúng tôi sẽ cần thực hiện các hành động sau:
- Tải lên dữ liệu thô
- Tạo luồng dữ liệu
- Hợp nhất Luồng dữ liệu thô vào một chế độ xem duy nhất
- Chuyển đổi dữ liệu
- Chạy và quản lý Luồng dữ liệu
Trước khi chúng tôi bắt đầu kiểm tra chi tiết trường hợp này, hãy đảm bảo tải xuống phiên bản Oracle Analytics Desktop mới nhất và cài đặt nó.
Tải lên dữ liệu thô
Đầu tiên, Bạn phải đăng nhập vào Oracle Analytics. Ở giai đoạn này, chúng tôi tải lên hai tập dữ liệu Bán hàng từ Chi nhánh 1 và Chi nhánh 2.
Mở Oracle Analytics Desktop, điều hướng đến góc trên cùng bên phải và nhấp vào Create > Data Set
Cửa sổ Create Data Set xuất hiện. Chọn Drop data và duyệt đến tệp dữ liệu.
Nhấp vào nút Add để thêm tập dữ liệu cần thiết.
Tiếp tục new data set cho dữ liệu Sales của Chi nhánh 2:
Tạo luồng dữ liệu
Mục tiêu của bước này là tạo dự án Luồng dữ liệu và kết hợp hai tập dữ liệu đã tải lên ở bước trước.
Ở góc trên cùng bên phải, nhấp vào Create > Data Flow
Trong cửa sổ Add Data Set , bạn có thể thêm tập dữ liệu của mình cùng một lúc hoặc chọn hoặc thêm chúng sau. Nhập Sales Data Branch trong trường tìm kiếm và chọn Sales Data Branch 1
Đổi tên dự án Luồng dữ liệu thành Sales Data Flow
Trên bảng Data Flow Steps , hãy kéo và thả thành phần Add Data vào vùng thiết kế.
Trong cửa sổ Add Data Set , hãy chọn tập Sales Data Branch 2. Nhấp vào biểu tượng Plus của Sales Data Branch 1 và chọn the Union Rows .
Theo mặc định, bạn thấy thông báo cảnh báo: Các hàng kết hợp chưa hoàn thành, hãy nhấp vào nút được đề xuất để hoàn thành nó . Đó là vì bạn không chọn bất kỳ tập dữ liệu nào cho quy trình Union . Bấm vào biểu tượng Circle của Sales Data Branch 2 để hoàn thành thành phần Union . Bạn cũng có thể đổi tên bước Union và cung cấp mô tả:
Bạn chọn tùy chọn All rows từ Input 1 và Input 2 (Union All)
Thành phần Union nhận được hai tập dữ liệu đầu vào.
Bây giờ, bạn cần đổi tên các cột thành những tên thuận tiện để sử dụng trong báo cáo của mình, chẳng hạn như Ngày đặt hàng, v.v. Nhấp vào biểu tượng Plus của Union Rows > Rename Columns.
Đổi tên các cột khi bạn cần.
Trong tập dữ liệu, bạn thấy rằng cột the State có thể để trống. Do đó, bạn cần chuyển đổi một giá trị rỗng thành N / A. Tiếp tục nhấp vào biểu tượng Dấu cộng của bước Rename Columns. Chọn bước Transform Column.
Trong trường hợp này, bạn sử dụng hàm IFNULL để kiểm tra xem Trạng thái có phải là NULL hay không, sau đó bạn sử dụng giá trị N / A.
Bấm Validate để đảm bảo không có lỗi cú pháp, sau đó Bấm Apply. Bạn có thể thấy giá trị N / A trong cột Trạng thái.
Tiếp tục thêm bước Split . Ở đây, bạn cần chia cột Order Date thành ba phần, sau đó kết hợp chúng để tạo một cột mới với Date datatype (dd / mm / yyyy).
Nội dung của cột Order Date được chia thành ba cột – Day, Month, và Năm Year Of Order Date . Bạn cần bước này vì Order Date có thể có các định dạng Date khác nhau , chẳng hạn như m / dd / yyyy, mm / dd / yyyy hoặc mm / d / yyyyy. Vì vậy, bạn cần chuẩn hóa định dạng và chuyển đổi nó sang kiểu dữ liệu Date.
Nhấp vào biểu tượng plus của bước Split Columns > Add Columns.
Nhập tên của cột mới Order Date Ext.
Nhập biểu thức:
TO_DATETIME(CONCAT(CONCAT(CONCAT(RIGHT(CONCAT(‘0’, Day,2), ‘/’),CONCAT(RIGHT(CONCAT(‘0’, Month),2), ‘/’)),REPLACE(Year of Order Date,’ 0:00′,”)),’dd/mm/yyyy’)
Mục đích của biểu thức này là kết hợp ba cột Day, Month, và Year of Order Date . Sau đó, sử dụng TO_DATETIME để chuyển đổi kết hợp sang kiểu dữ liệu DATE trong định dạng dd / mm / yyyy.
Tiếp theo, bạn cần lưu kết hợp vào tập dữ liệu cuối cùng. Nhấp vào biểu tượng plus của Add Columns > bước Save Data step.
- Nhập tên tập dữ liệu của bạn: Sales Data All Branches
- Lưu dữ liệu vào Data Set Storage
- Chọn Data Set Storage để lưu dữ liệu đầu ra trong tập dữ liệu trong Oracle Analytics .
- Chọn Database Connection để lưu dữ liệu đầu ra ở một trong các kiểu cơ sở dữ liệu được hỗ trợ.
- Cập nhật các cột sau để Measure in Treat As. Các cột khác phải là Attribute. Mục đích của cột Measure là hỗ trợ các chức năng Aggregation tự động, chẳng hạn như SUM, COUNT, v.v. khi bạn tạo báo cáo
- Số lượng đặt hàng
- Việc bán hàng
- Nhấp vào Save và Run Data Flow
Quay lại Trang chủ của Oracle Analytic. Nhấp vào biểu tượng hamburger ở góc trên bên trái> Data menu
Bây giờ, bạn có thể xem the Sales Data All Branches đã được tạo sau khi dòng dữ liệu của bạn chạy.
Bạn có thể bắt đầu trực quan hóa và xây dựng báo cáo dựa trên tập dữ liệu đã hoàn thiện của mình.
Kết luận
Hướng dẫn này cho phép chúng ta làm quen với một vài bước trong Luồng dữ liệu, chẳng hạn như Liên kết Hàng, Tách và Thêm Cột. Các tùy chọn này cho phép bạn kết hợp nhiều tệp thô trong một chế độ xem (tập dữ liệu) để phân tích dữ liệu dựa trên tập dữ liệu kết hợp.
Luồng dữ liệu của Oracle Analytics cho phép bạn trích xuất, tải và chuyển đổi dữ liệu bằng cách kéo và thả các thành phần được tạo sẵn. Nó cho phép dễ dàng xây dựng Luồng dữ liệu một cách dễ dàng mà không cần tham khảo nhóm kỹ thuật.
Các phép biến đổi phức tạp yêu cầu các hàm tạo sẵn như:
- STRING
- DATE
- Operators
- Math
- Conversion
- Aggregation
Hướng dẫn tiếp theo sẽ tập trung vào việc xây dựng Luồng dữ liệu để phân tích cảm tính dựa trên phản hồi về tập dữ liệu của khách hàng.
Nguồn: Internet
Chúng tôi chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/ Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn như: Nakagawa, Mutoshi, Tinh Vân Group,….. đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.