Chuyên gia Việt kiều đưa ra 3 mô hình thu thập dữ liệu dạng ve, nhện và cáo mà doanh nghiệp có thể áp dụng.
Hầu hết các doanh nghiệp đã xác định được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số và phát triển công ty. Nhưng nhiều người không hiểu cách xây dựng dữ liệu, xác định dữ liệu sẽ sử dụng và cách áp dụng dữ liệu một cách hiệu quả.
Làm thế nào để hiểu dữ liệu lớn?
Tại sự kiện Vietnam Data Summit 2022 vừa qua, ông Albert Antoine – chuyên gia khoa học dữ liệu và trí tuệ nhân tạo, đồng sáng lập Avaiga – đã giải đáp thắc mắc trên, đồng thời đưa ra một số lời khuyên. Lời khuyên cho các doanh nghiệp trên hành trình chuyển đổi số của mình.
Vị chuyên gia Việt kiều này cho biết, dữ liệu hiện có ở khắp mọi nơi, trong đó, điện thoại thông minh mà người dân đang sử dụng là đối tượng thu thập dữ liệu phổ biến nhất.
Tuy nhiên, để xây dựng dữ liệu lớn, cần xác định rõ các tiêu chí ngay từ đầu. Về cơ bản, dữ liệu lớn được định nghĩa khoảng 5 Vs. Đầu tiên, khối lượng dữ liệu phải đủ lớn. Ví dụ, mỗi ngày hệ thống bán lẻ Walmart ở Mỹ tạo ra khoảng 24-25 TB dữ liệu (trong khi smartphone mạnh nhất hiện nay có dung lượng lưu trữ tối đa là 1TB).
Tiếp theo, dữ liệu phải có sự đa dạng (đa dạng), từ hình ảnh, âm thanh, chữ viết, … cho đến video, bài báo. Việc thu thập và khai thác dữ liệu cũng cần dựa vào yếu tố tốc độ (vận tốc), ví dụ khi vận hành xe tự lái, lượng dữ liệu thu thập và xử lý phải được thực hiện theo thời gian thực để giúp xe xử lý sự cố. xử lý tình huống ngay lập tức.
Ngoài ra, dữ liệu thu thập phải chính xác (tính xác thực), vì thu thập sai sẽ dẫn đến kết quả sai. Vì vậy, người ta phải bỏ ra tới 80% công sức để “làm sạch” dữ liệu trước khi đưa vào sử dụng. Cuối cùng, dữ liệu phải có một giá trị.
Ông Albert Antoine trình bày tại Vietnam Data Summit 2022. (Ảnh: Hải Đăng) |
Chiến lược thu thập dữ liệu của nhện và cáo
Sau khi xác định tầm quan trọng của dữ liệu và loại dữ liệu cần thu thập, có ba cách để lấy dữ liệu.
Đối với những doanh nghiệp chưa từng có cơ sở dữ liệu, họ cần phải đăng ký hoặc mua dữ liệu. Phương pháp này được Antoine so sánh với kiểu ve sầu trong truyện ngụ ngôn: mùa hè ve sầu mải hót, mùa đông không có thức ăn nên phải đi ăn xin từ những con kiến hoạt động quanh năm.
Ở cách thứ hai, một số doanh nghiệp áp dụng nguyên tắc con nhện, tức là cung cấp dịch vụ để khách hàng sử dụng, từ đó thu thập dữ liệu. Ví dụ, khi bạn sử dụng Wi-Fi công cộng miễn phí, bạn thường phải cung cấp địa chỉ email – cũng là một dạng dữ liệu.
Các doanh nghiệp có cơ sở hạ tầng tiên tiến sẽ áp dụng nguyên tắc của con cáo: cung cấp công cụ phân tích cho những người đã có dữ liệu, sau đó sử dụng kết quả phân tích để bán cho những người cần. Ví dụ, các doanh nghiệp toàn cầu như Facebook và Google đang áp dụng cả chiến lược con nhện và con cáo.
Một chuyên gia từng tư vấn cho nhiều doanh nghiệp và chính phủ cho biết: “Khi bạn đọc sách Kindle của Amazon, bạn nghĩ rằng bạn đang đọc một cuốn sách, nhưng cuốn sách thực sự đang ‘đọc’ bạn.
Anh ta ám chỉ thực tế rằng mỗi khi bạn tạm dừng, đọc thêm một đoạn văn nào đó đang cung cấp hành vi cho máy thu thập dữ liệu.
Thế giới sử dụng dữ liệu để làm gì?
Sau khi có dữ liệu lớn, trên thế giới hiện nay có rất nhiều xu hướng. Rõ ràng nhất là mô hình bot / công nhân kỹ thuật số. Nhờ dữ liệu lớn và máy học, các doanh nghiệp xây dựng bot để giao tiếp với khách hàng trực tuyến. Ở Việt Nam hay toàn cầu, khi bạn trò chuyện với nhà điều hành, bạn thường đang nói chuyện với một hệ thống máy tính (bot). Các bot ngày nay khá thông minh, thậm chí có thể chốt lệnh mà không cần con người can thiệp.
Ngoài ra, thông tin thu thập được có thể được sử dụng trong ngành phân tích dữ liệu. Thông qua hệ thống máy tính, dữ liệu có thể được sử dụng để phân tích các sự kiện đã diễn ra, chẳng hạn như đưa ra kết quả kinh doanh cho doanh nghiệp. Nếu AI / ML được áp dụng, có thể dự báo các xu hướng kinh doanh và các sự kiện tiếp theo. Các thuật toán cũng có thể đưa ra lời khuyên để hỗ trợ con người thực hiện các hành động tiếp theo.
Mặc dù nhiều doanh nghiệp đã nhận ra tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, nhưng không phải doanh nghiệp nào cũng đang đi đúng hướng.
“Nhiều doanh nghiệp nghĩ rằng chuyển đổi số chỉ cần mua phần mềm là xong, nhưng thực tế không phải vậy. Điều quan trọng là sự sắp xếp hoạt động của doanh nghiệp trong quá trình thay đổi của công ty ”, ông Antoine nhấn mạnh.
Vị chuyên gia cho rằng, trong quá trình chuyển đổi số và xây dựng dữ liệu, tất cả mọi người đều phải tham gia. Thông thường, giữa các bộ phận, đơn vị trong một tổ chức không chia sẻ dữ liệu với nhau, vì nó không thuộc phạm vi công việc của họ. Do đó, cần đưa nội dung hợp tác và chia sẻ dữ liệu như một nhiệm vụ trong công việc hàng ngày để nhân viên thực hiện.
Ngoài ra, để lấy dữ liệu, doanh nghiệp cần cung cấp công cụ công nghệ cho nhân viên. Vì nếu không hoạt động trên nền tảng công nghệ thì không thể cho ra dữ liệu.
Cuối cùng, để xây dựng dữ liệu, các nhà lãnh đạo phải xác định doanh nghiệp của họ xung quanh dữ liệu. Phải trao đổi rõ ràng, minh bạch với nhân viên ngay từ đầu để nâng cao nhận thức cho họ. Kể từ đó, mọi người đều tập trung vào việc xây dựng và sản xuất dữ liệu.
Ngọn hải đăng
Meta đã kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ chăm sóc sức khỏe
Theo Bloomberg, Meta đã bị kiện vì cho phép bí mật chia sẻ dữ liệu y tế riêng tư với Facebook mỗi khi bệnh nhân truy cập trang web của một số nhà cung cấp dịch vụ chăm sóc sức khỏe nhất định.