Dữ liệu không chỉ là một tài sản kỹ thuật số của doanh nghiệp hiện đại mà là một yếu tố thiết yếu. Trước đây, dữ liệu chủ yếu được thu thập để đo lường những gì đã xảy ra (phân tích mô tả) hoặc lý do tại sao điều đó xảy ra (phân tích chẩn đoán). Ngày nay, dữ liệu còn thúc đẩy các mô hình phân tích dự đoán (dự báo tương lai) và phân tích đề xuất (tối ưu hóa kết quả trong tương lai). Các nhà lãnh đạo ngày nay không chỉ cần những báo cáo để “nhìn lại”, họ đòi hỏi cả những insight cho tương lai để tăng ưu thế cạnh tranh và mở rộng thị trường.
Tuy nhiên, khi dòng dữ liệu không phải theo quý, theo tháng, hay hàng ngày, mà là dữ liệu truyền trực tuyến theo thời gian thực, thách thức cho doanh nghiệp theo đó cũng tăng lên gấp bội: nhân lực và công nghệ phải được khai thác, điều hòa và đồng bộ để theo kịp với dòng dữ liệu trong các quá trình hoạt động của doanh nghiệp.
1. Hiện trạng tốc độ không đồng bộ giữa hoạt động kinh doanh và dòng dữ liệu
Trong những ngày đầu của cuộc cách mạng phân tích dữ liệu hiện nay, người ta thường nghe đến việc chủ doanh nghiệp mong muốn dữ liệu phải theo kịp tốc độ của hoạt động kinh doanh. Tuy nhiên, dần dần, người ta nhận ra rằng vấn đề thực tế lại ngược lại: tốc độ của doanh nghiệp cần phải bắt kịp tốc độ của dòng dữ liệu.
Trên thực tế, chúng ta vẫn chưa hoàn toàn hiểu rõ về thế giới dữ liệu. Khi có một biển dữ liệu theo ý mình, chúng ta thường có xu hướng đặt câu hỏi về nó: "Mẫu hình đó là gì?" "Tại sao xu hướng này thay đổi?" "Tính năng mới này đến từ đâu?" "Có điều gì bất thường?" "Mẫu hình này trong dữ liệu mang ý nghĩa gì?" "Điều đó ảnh hưởng đến quyết định hoặc hành động tiếp theo của tôi như thế nào?" "Đây có phải là một xu hướng mới hay là một xu hướng hiện có mà tôi đã bỏ qua?" "Làm thế nào để tôi có thể hiểu thêm về những gì đang diễn ra?" Và rất nhiều các câu hỏi khác.
Tương tự như vậy, tần suất liên tục của các bài toán doanh nghiệp cũng tăng tốc cả quy trình hoạt động của doanh nghiệp đó. Việc tiếp cận với dữ liệu và các phép phân tích dữ liệu tốc độ cao đã tạo điều kiện giải quyết bài toán đó. Nhưng phân tích nhanh đòi hỏi việc truy cập nhanh hơn, tới nhiều dữ liệu hơn, để có thể hoàn toàn giải quyết vấn đề trên.
2. Một hướng mới cho giải pháp “Mơ hồ dữ liệu”:
Quá trình đưa dữ liệu mới có ý nghĩa vào kho lưu trữ và đưa dữ liệu sẵn có từ kho lưu trữ vào ứng dụng trong thực tiễn không thể bị tắc nghẽn. Khi “vùng cổ chai” dữ liệu xuất hiện, không chỉ người dùng trực tiếp không hài lòng, quy trình bị đình trệ, mà hiệu ứng tỏa sóng theo cấp số nhân cũng có thể kéo theo trên cả hệ thống. Để giải quyết vấn đề tăng sinh thể tích dữ liệu và nhu cầu gia tăng đối với phân tích hiệu suất cao, các giải pháp đám mây hiện tại có thể gây khá nhiều tốn kém, ngược lại, các cách tiếp cận tại chỗ đang là hướng đi đúng đắn hơn.
Theo đó, cơ sở dữ liệu của một tổ chức cần phải trở thành trọng tâm của các cuộc thảo luận, đặc biệt là trong câu chuyện chiến lược phân tích dữ liệu kinh doanh. Nói cách khác, một nhà lãnh đạo doanh nghiệp cần đặt câu hỏi: "Làm thế nào để phân tích dữ liệu với tốc độ tương đương với các bài toán kinh doanh?"
Trong quá khứ, cơ sở dữ liệu thường được coi là phạm vi của team IT chứ không phải dành cho các nhà hoạch định chiến lược. Tuy nhiên, tất cả chúng ta đều bắt đầu làm quen với lưu trữ và cơ sở dữ liệu từ các dự án đầu tiên của mình. Có thể tạm gọi là sự "mơ hồ dữ liệu" - khi ta có có nhiều dữ liệu nhưng không biết phân tích và sử dụng sao cho hiệu quả.
Sau này, các giải pháp lưu trữ đám mây được phát hiện và được sử dụng trong một thời gian dài. Lưu trữ đám mây hiện tại vẫn hữu hiệu, nhưng giờ đây nó có thể được kết hợp với các giải pháp cơ sở dữ liệu tại chỗ (on-premise) - giải pháp đám mây lai (hybrid cloud).
Các giải pháp kho dữ liệu tại chỗ (bao gồm cả private cloud) đặc biệt phù hợp (thậm chí là cần thiết) trong ba trường hợp:
a, Dữ liệu nhạy cảm phải lưu trữ nội bộ:
Do vấn đề bảo mật, pháp lý hoặc quy định, một số dữ liệu nhất định của doanh nghiệp không được phép lưu trữ bên ngoài cơ sở vật lý của họ. Trong những trường hợp này, cơ sở hạ tầng dữ liệu tại chỗ là lựa chọn bắt buộc.
b, Phân tích luồng dữ liệu trực tuyến từ cảm biến tại chỗ:
Nhiều doanh nghiệp thu thập dữ liệu liên tục từ các cảm biến được đặt ngay trong cơ sở của họ, ví dụ như dữ liệu từ mạng nội bộ, bản ghi an ninh, giao dịch khách hàng, hoạt động nội bộ và hệ thống độc quyền, v.v, lưu trữ dữ liệu tại chỗ đáp ứng yêu cầu này tốt hơn so với lưu trữ đám mây.
c, Truy cập dữ liệu độ trễ thấp là rất cần thiết:
Đối với một số phân tích kinh doanh, tốc độ là yếu tố then chốt. Để phân tích dữ liệu theo thời gian thực (real-time), cần truy cập dữ liệu với độ trễ thấp (ít chậm trễ). Cơ sở hạ tầng dữ liệu tại chỗ giúp giảm thiểu độ trễ, cho phép phân tích diễn ra với tốc độ ngang bằng với tốc độ đặt ra các bài toán kinh doanh. Điều này giúp các tổ chức thoát khỏi tình trạng "mơ hồ dữ liệu".
>>> Doanh nghiệp hiện tại đang đối mặt với tình trạng có quá nhiều dữ liệu trong tay nhưng không thể xử lý dữ liệu đủ nhanh để theo kịp các bài toán kinh doanh trong thời gian thực. Nhìn chung, kho dữ liệu tại chỗ là lựa chọn phù hợp hiện nay để phục vụ cho nhu cầu truy cập nhanh và với dòng dữ liệu lớn, đặc biệt khi tính bảo mật, phân tích dữ liệu theo thời gian thực và tốc độ truy cập dữ liệu là những ưu tiên hàng đầu.
Chia sẻ: