Chào mừng bạn đến với INDA!

Hotline: (HN) (+84) 986-882-818 | (HCM) (+84) 945-618-746

Thiết lập Data Flow (Luồng dữ liệu) trong Oracle Analytics

Thiết lập Data Flow (Luồng dữ liệu) trong Oracle Analytics

Oracle Analytics

Cách tiếp cận truyền thống đối với quá trình chuyển đổi (Trích xuất, Tải, Chuyển đổi) yêu cầu người dùng kỹ thuật tham gia trực tiếp. Chúng thực hiện kết nối với các nguồn dữ liệu, chuyển đổi dữ liệu và cung cấp bộ dữ liệu cuối cùng cho người dùng doanh nghiệp.

Quá trình này thường đòi hỏi nhiều thời gian bất cứ khi nào người dùng doanh nghiệp yêu cầu thêm thông tin hoặc do những thay đổi / cập nhật trong logic nghiệp vụ. Sau đó, người dùng kỹ thuật phải hoàn nguyên tập dữ liệu và chuyển đổi.

Luồng dữ liệu trong Oracle Analytics là giải pháp cho người dùng doanh nghiệp cho phép họ tạo các phép biến đổi tuần tự cho tập dữ liệu của họ. Giao diện người dùng cung cấp một tập hợp các thành phần để thực hiện chuyển đổi mà không cần tập kỹ năng lập trình cho các mục tiêu sau:

  • Kết hợp, biến đổi và tích hợp các tập dữ liệu
  • Chuẩn bị các bộ dữ liệu được quản lý để phân tích thêm
  • Gửi tập dữ liệu được quản lý tới cơ sở dữ liệu quan hệ hoặc Essbase
  • Xây dựng đào tạo các mô hình học máy

Các bài viết hiện tại sẽ tập trung vào việc sử dụng Luồng dữ liệu để xây dựng Phân tích cảm xúc. Đây là một trong những trường hợp sử dụng phổ biến liên quan đến tập dữ liệu khách hàng để nhận xét, phản hồi, v.v.

Tổng quan về cách sử dụng

Giả sử rằng bạn có một nhiệm vụ khẩn cấp là phân tích dữ liệu Bán hàng cho các chi nhánh cụ thể.

Bạn đã yêu cầu nhóm CNTT trích xuất dữ liệu thành nhiều bộ dữ liệu. Bây giờ, bạn cần kết hợp tất cả các tập dữ liệu vào một chế độ xem duy nhất và xây dựng báo cáo mà không cần nỗ lực vào quá trình chuyển đổi.

Chúng tôi sẽ cần thực hiện các hành động sau:

  • Tải lên dữ liệu thô
  • Tạo luồng dữ liệu
  • Hợp nhất Luồng dữ liệu thô vào một chế độ xem duy nhất
  • Chuyển đổi dữ liệu
  • Chạy và quản lý Luồng dữ liệu

Trước khi chúng tôi bắt đầu kiểm tra chi tiết trường hợp này, hãy đảm bảo tải xuống phiên bản Oracle Analytics Desktop mới nhất và cài đặt nó.

Tải lên dữ liệu thô

Đầu tiên, Bạn phải đăng nhập vào Oracle Analytics. Ở giai đoạn này, chúng tôi tải lên hai tập dữ liệu Bán hàng từ Chi nhánh 1 và Chi nhánh 2.

Mở Oracle Analytics Desktop, điều hướng đến góc trên cùng bên phải và nhấp vào Create > Data Set

Cửa sổ Create Data Set xuất hiện. Chọn Drop data và duyệt đến tệp dữ liệu.

Cửa sổ Tạo Tập dữ liệu xuất hiện.  Chọn Thả dữ liệu và duyệt đến tệp dữ liệu.

Nhấp vào nút Add để thêm tập dữ liệu cần thiết.

Nhấp vào nút Thêm để thêm tập dữ liệu cần thiết.

Tiếp tục new data set cho dữ liệu Sales của Chi nhánh 2:

Tiếp tục thêm tập dữ liệu mới cho dữ liệu Bán hàng của Chi nhánh 2:

Tạo luồng dữ liệu

Mục tiêu của bước này là tạo dự án Luồng dữ liệu và kết hợp hai tập dữ liệu đã tải lên ở bước trước.

Ở góc trên cùng bên phải, nhấp vào Create > Data Flow

Ở góc trên cùng bên phải, nhấp vào Tạo> Luồng dữ liệu

Trong cửa sổ  Add Data Set , bạn có thể thêm tập dữ liệu của mình cùng một lúc hoặc chọn hoặc thêm chúng sau. Nhập Sales Data Branch trong trường tìm kiếm và chọn  Sales Data Branch 1

Nhập Nhánh dữ liệu bán hàng trong trường tìm kiếm và chọn Nhánh dữ liệu bán hàng 1

Đổi tên dự án Luồng dữ liệu thành Sales Data Flow

Đổi tên dự án Luồng dữ liệu thành Luồng dữ liệu bán hàng

Trên bảng Data Flow Steps , hãy kéo và thả thành phần Add Data vào vùng thiết kế.

Trên bảng Các bước luồng dữ liệu, hãy kéo và thả thành phần Thêm dữ liệu vào vùng thiết kế.

Trong cửa sổ Add Data Set , hãy chọn tập Sales Data Branch 2. Nhấp vào biểu tượng Plus của Sales Data Branch 1 và chọn the Union Rows .

Trong cửa sổ Thêm tập dữ liệu, hãy chọn tập dữ liệu Nhánh dữ liệu bán hàng 2.  Nhấp vào biểu tượng Dấu cộng của Nhánh Dữ liệu Bán hàng 1 và chọn bước Liên hợp Hàng.

Theo mặc định, bạn thấy thông báo cảnh báo: Các hàng kết hợp chưa hoàn thành, hãy nhấp vào nút được đề xuất để hoàn thành nó . Đó là vì bạn không chọn bất kỳ tập dữ liệu nào cho quy trình Union . Bấm vào biểu tượng Circle của Sales Data Branch 2 để hoàn thành thành phần Union . Bạn cũng có thể đổi tên bước Union và cung cấp mô tả:

thông báo cảnh báo: Các hàng kết hợp chưa hoàn thành, hãy nhấp vào nút được đề xuất để hoàn thành nó.

Bạn chọn tùy chọn All rows từ  Input 1 và  Input 2 (Union All)

Bạn chọn tùy chọn Tất cả các hàng từ Đầu vào 1 và Đầu vào 2 (Liên hợp Tất cả)

Thành phần Union nhận được hai tập dữ liệu đầu vào.

Bây giờ, bạn cần đổi tên các cột thành những tên thuận tiện để sử dụng trong báo cáo của mình, chẳng hạn như Ngày đặt hàng, v.v. Nhấp vào biểu tượng Plus của Union Rows > Rename Columns.

đổi tên các cột thành tên thuận tiện để sử dụng trong báo cáo của bạn, chẳng hạn như Ngày đặt hàng, v.v.

Đổi tên các cột khi bạn cần.

Đổi tên các cột khi bạn cần.

Trong tập dữ liệu, bạn thấy rằng cột the State có thể để trống. Do đó, bạn cần chuyển đổi một giá trị rỗng thành N / A. Tiếp tục nhấp vào biểu tượng Dấu cộng của bước Rename Columns. Chọn bước Transform Column.

Tiếp tục nhấp vào biểu tượng Dấu cộng của bước Đổi tên cột.  Chọn bước Chuyển đổi Cột.

Trong trường hợp này, bạn sử dụng hàm IFNULL để kiểm tra xem Trạng thái có phải là NULL hay không, sau đó bạn sử dụng giá trị N / A.

Bấm Validate để đảm bảo không có lỗi cú pháp, sau đó Bấm Apply. Bạn có thể thấy giá trị N / A trong cột Trạng thái.

Giá trị N / A trong cột Trạng thái.

Tiếp tục thêm bước Split . Ở đây, bạn cần chia cột Order Date thành ba phần, sau đó kết hợp chúng để tạo một cột mới với Date datatype (dd / mm / yyyy).

chia cột Ngày đặt hàng thành ba phần, sau đó kết hợp chúng để tạo cột mới với kiểu dữ liệu Ngày (dd / mm / yyyy).

Nội dung của cột Order Date được chia thành ba cột –  Day, Month, và Năm Year Of Order Date . Bạn cần bước này vì Order Date có thể có các định dạng Date khác nhau , chẳng hạn như m / dd / yyyy, mm / dd / yyyy hoặc mm / d / yyyyy. Vì vậy, bạn cần chuẩn hóa định dạng và chuyển đổi nó sang kiểu dữ liệu Date.

Nhấp vào biểu tượng plus của bước Split Columns > Add Columns.

Nhấp vào biểu tượng Dấu cộng của bước Chia cột> Thêm cột.

Nhập tên của cột mới Order Date Ext.

Nhập biểu thức:

TO_DATETIME(CONCAT(CONCAT(CONCAT(RIGHT(CONCAT(‘0’, Day,2), ‘/’),CONCAT(RIGHT(CONCAT(‘0’, Month),2), ‘/’)),REPLACE(Year of Order Date,’ 0:00′,”)),’dd/mm/yyyy’)

Mục đích của biểu thức này là kết hợp ba cột Day, Month, và Year of Order Date . Sau đó, sử dụng TO_DATETIME để chuyển đổi kết hợp sang kiểu dữ liệu DATE trong định dạng dd / mm / yyyy.

sử dụng TO_DATETIME để chuyển đổi kết hợp thành kiểu dữ liệu DATE trong định dạng dd / mm / yyyy.

Tiếp theo, bạn cần lưu kết hợp vào tập dữ liệu cuối cùng. Nhấp vào biểu tượng plus của Add Columns > bước Save Data step.

Tiếp theo, bạn cần lưu kết hợp vào tập dữ liệu cuối cùng.  Nhấp vào biểu tượng Dấu cộng của bước Thêm cột> bước Lưu dữ liệu.
  • Nhập tên tập dữ liệu của bạn: Sales Data All Branches
  • Lưu dữ liệu vào Data Set Storage
    • Chọn Data Set Storage để lưu dữ liệu đầu ra trong tập dữ liệu trong Oracle Analytics .
    • Chọn Database Connection để lưu dữ liệu đầu ra ở một trong các kiểu cơ sở dữ liệu được hỗ trợ.
  • Cập nhật các cột sau để Measure in Treat As. Các cột khác phải là Attribute. Mục đích của cột Measure là hỗ trợ các chức năng Aggregation tự động, chẳng hạn như SUM, COUNT, v.v. khi bạn tạo báo cáo
    • Số lượng đặt hàng
    • Việc bán hàng
  • Nhấp vào SaveRun Data Flow
Nhấp vào Lưu và chạy Luồng dữ liệu

Quay lại Trang chủ của Oracle Analytic. Nhấp vào biểu tượng hamburger ở góc trên bên trái> Data menu

Bây giờ, bạn có thể xem the Sales Data All Branches đã được tạo sau khi dòng dữ liệu của bạn chạy.

Dữ liệu bán hàng Tập dữ liệu tất cả các chi nhánh đã được tạo sau khi dòng dữ liệu của bạn chạy.

Bạn có thể bắt đầu trực quan hóa và xây dựng báo cáo dựa trên tập dữ liệu đã hoàn thiện của mình.

hiển thị và xây dựng báo cáo dựa trên tập dữ liệu đã hoàn thiện của bạn

Kết luận

Hướng dẫn này cho phép chúng ta làm quen với một vài bước trong Luồng dữ liệu, chẳng hạn như Liên kết Hàng, Tách và Thêm Cột. Các tùy chọn này cho phép bạn kết hợp nhiều tệp thô trong một chế độ xem (tập dữ liệu) để phân tích dữ liệu dựa trên tập dữ liệu kết hợp.

Luồng dữ liệu của Oracle Analytics cho phép bạn trích xuất, tải và chuyển đổi dữ liệu bằng cách kéo và thả các thành phần được tạo sẵn. Nó cho phép dễ dàng xây dựng Luồng dữ liệu một cách dễ dàng mà không cần tham khảo nhóm kỹ thuật.

Các phép biến đổi phức tạp yêu cầu các hàm tạo sẵn như:

  • STRING
  • DATE
  • Operators
  • Math
  • Conversion
  • Aggregation

Hướng dẫn tiếp theo sẽ tập trung vào việc xây dựng Luồng dữ liệu để phân tích cảm tính dựa trên phản hồi về tập dữ liệu của khách hàng.

Nguồn: Internet

Chúng tôi chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/ Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn như: Nakagawa, Mutoshi, Tinh Vân Group,….. đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.

LIÊN HỆ VỚI INDA

TIN TỨC LIÊN QUAN

GỬI THÔNG TIN THÀNH CÔNG!
CHÚNG TÔI SẼ LIÊN HỆ TRONG THỜI GIAN SỚM NHẤT!
CẢM ƠN QUÝ KHÁCH!
GỬI THÔNG TIN THÀNH CÔNG!
CẢM ƠN BẠN ĐÃ ỨNG TUYỂN VÀO CÔNG TY