Hầu hết các doanh nghiệp đã xác định được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số và phát triển công ty. Nhưng nhiều người không hiểu cách xây dựng dữ liệu, xác định dữ liệu sẽ sử dụng và cách áp dụng dữ liệu một cách hiệu quả.
Làm thế nào để hiểu dữ liệu lớn?
Tại sự kiện Vietnam Data Summit 2022 vừa qua, ông Albert Antoine – chuyên gia khoa học dữ liệu và trí tuệ nhân tạo, đồng sáng lập Avaiga – đã giải đáp thắc mắc trên và đưa ra một số lời khuyên. Lời khuyên cho các doanh nghiệp trên hành trình chuyển đổi số của mình.
Vị chuyên gia Việt kiều này cho biết, dữ liệu hiện có ở khắp mọi nơi, trong đó điện thoại thông minh người dân đang sử dụng là đối tượng thu thập dữ liệu phổ biến nhất.
Tuy nhiên, để xây dựng dữ liệu lớn, cần xác định rõ các tiêu chí ngay từ đầu. Về cơ bản, dữ liệu lớn được định nghĩa khoảng 5 Vs. Đầu tiên, khối lượng dữ liệu phải đủ lớn. Ví dụ, hệ thống bán lẻ Walmart ở Mỹ tạo ra khoảng 24-25 TB dữ liệu mỗi ngày (trong khi điện thoại thông minh mạnh mẽ nhất hiện nay có dung lượng lưu trữ tối đa là 1TB).
Tiếp theo, dữ liệu phải có sự đa dạng (đa dạng), từ hình ảnh, âm thanh, chữ viết, … cho đến video, bài báo. Việc thu thập và trích xuất dữ liệu cũng cần dựa trên yếu tố tốc độ (vận tốc), ví dụ như khi vận hành xe tự lái, lượng dữ liệu thu thập và xử lý phải được thực hiện theo thời gian thực để giúp xe xử lý sự cố. xử lý tình huống ngay lập tức.
Ngoài ra, dữ liệu thu thập phải chính xác (tính xác thực), vì thu thập sai sẽ dẫn đến kết quả sai. Vì vậy, người ta phải bỏ ra tới 80% công sức để “làm sạch” dữ liệu trước khi đưa vào sử dụng. Cuối cùng, dữ liệu phải có một giá trị.
Chiến lược thu thập dữ liệu của nhện và cáo
Sau khi xác định tầm quan trọng của dữ liệu và loại dữ liệu cần thu thập, có ba cách để lấy dữ liệu.
Đối với những doanh nghiệp chưa từng có cơ sở dữ liệu, họ cần phải đăng ký hoặc mua dữ liệu. Phương pháp này được Antoine so sánh với kiểu ve sầu trong truyện ngụ ngôn: mùa hè ve sầu hót, mùa đông không có thức ăn nên phải đi ăn xin từ loài kiến hoạt động quanh năm.
Ở cách thứ hai, một số doanh nghiệp áp dụng nguyên tắc con nhện, tức là cung cấp dịch vụ để khách hàng sử dụng, từ đó thu thập dữ liệu. Ví dụ, khi bạn sử dụng Wi-Fi công cộng miễn phí, bạn thường phải cung cấp địa chỉ email – cũng là một dạng dữ liệu.
Các doanh nghiệp có cơ sở hạ tầng tiên tiến sẽ áp dụng nguyên tắc của con cáo: cung cấp công cụ phân tích cho những người đã có dữ liệu, sau đó sử dụng kết quả phân tích để bán cho những người cần. Ví dụ, các doanh nghiệp toàn cầu như Facebook và Google đang áp dụng cả chiến lược con nhện và con cáo.
Một chuyên gia từng tư vấn cho nhiều doanh nghiệp và chính phủ cho biết: “Khi bạn đọc sách Kindle của Amazon, bạn nghĩ rằng bạn đang đọc một cuốn sách, nhưng cuốn sách thực sự đang ‘đọc’ bạn.
Anh ta ám chỉ thực tế rằng mỗi khi bạn tạm dừng, đọc thêm một đoạn văn nào đó đang cung cấp hành vi cho máy thu thập dữ liệu.
Thế giới sử dụng dữ liệu để làm gì?
Sau khi có dữ liệu lớn, trên thế giới hiện nay có rất nhiều xu hướng. Rõ ràng nhất là mô hình bot / công nhân kỹ thuật số. Nhờ dữ liệu lớn và máy học, các doanh nghiệp xây dựng bot để giao tiếp với khách hàng trực tuyến. Ở Việt Nam hay toàn cầu, khi bạn trò chuyện với nhà điều hành, bạn thường đang nói chuyện với một hệ thống máy tính (bot). Các bot ngày nay khá thông minh, thậm chí có thể chốt lệnh mà không cần con người can thiệp.
Ngoài ra, thông tin thu thập được có thể được sử dụng trong ngành phân tích dữ liệu. Thông qua hệ thống máy tính, dữ liệu có thể được sử dụng để phân tích các sự kiện đã diễn ra, chẳng hạn như đưa ra kết quả kinh doanh cho doanh nghiệp. Nếu AI / ML được áp dụng, có thể dự đoán các xu hướng kinh doanh và các sự kiện tiếp theo. Các thuật toán cũng có thể đưa ra lời khuyên để hỗ trợ con người thực hiện các hành động tiếp theo.
Mặc dù nhiều doanh nghiệp đã nhận ra tầm quan trọng của dữ liệu trong chuyển đổi số, nhưng không phải doanh nghiệp nào cũng đang đi đúng hướng.
“Nhiều doanh nghiệp nghĩ rằng chuyển đổi số chỉ cần mua phần mềm là xong, nhưng thực tế không phải vậy. Điều quan trọng là sự sắp xếp hoạt động của doanh nghiệp trong quá trình thay đổi của công ty ”, ông Antoine nhấn mạnh.
Vị chuyên gia cho rằng, trong quá trình chuyển đổi số và xây dựng dữ liệu, tất cả mọi người đều phải tham gia. Thông thường, giữa các bộ phận, đơn vị trong một tổ chức không chia sẻ dữ liệu với nhau, vì nó không thuộc phạm vi công việc của họ. Do đó, cần đưa nội dung hợp tác và chia sẻ dữ liệu như một nhiệm vụ trong công việc hàng ngày để nhân viên thực hiện.
Ngoài ra, để lấy dữ liệu, doanh nghiệp cần cung cấp công cụ công nghệ cho nhân viên. Vì nếu không hoạt động trên nền tảng công nghệ thì không thể cho ra dữ liệu.
Cuối cùng, để xây dựng dữ liệu, các nhà lãnh đạo phải xác định doanh nghiệp của họ xung quanh dữ liệu. Phải trao đổi rõ ràng, minh bạch với nhân viên ngay từ đầu để nâng cao nhận thức cho họ. Từ đó, mọi người đều tập trung vào việc xây dựng và sản xuất dữ liệu.