Tuy nhiên, đằng sau khoản thu nhập nhanh là những rủi ro dài hạn về quyền riêng tư, deepfake và kiểm soát danh tính số.

Một buổi sáng năm ngoái, Jacobus Louw, một thanh niên 27 tuổi sống tại Cape Town (Nam Phi), đi bộ quanh khu phố như thường lệ để cho chim hải âu ăn. Nhưng lần này, anh mang theo Điện thoại để quay lại bước chân và khung cảnh vỉa hè trên đường đi.
Đoạn video dài vài phút giúp Louw kiếm được 14 USD – gần gấp 10 lần mức lương tối thiểu tại địa phương, tương đương nửa tuần tiền thực phẩm của anh.
Video đó được đăng lên Kled AI, một ứng dụng trả tiền cho người dùng khi họ tải lên dữ liệu như ảnh và video đời sống thường ngày để huấn luyện các mô hình Trí tuệ nhân tạo. Chỉ trong vài tuần, Louw đã kiếm được khoảng 50 USD bằng cách ghi lại những khoảnh khắc sinh hoạt thường nhật.
Không chỉ riêng anh.
Ở Ranchi (Ấn Độ), Sahil Tigga, một sinh viên 22 tuổi, kiếm tiền bằng cách để ứng dụng Silencio truy cập microphone điện thoại của mình để ghi lại âm thanh môi trường như tiếng giao thông, nhà hàng hay các khu phố đông đúc. Anh thậm chí còn đi đến những địa điểm mới, chẳng hạn sảnh khách sạn, để thu thập âm thanh chưa từng được ghi nhận trên bản đồ của ứng dụng.
Mỗi tháng Tigga kiếm hơn 100 USD từ công việc này – đủ chi trả toàn bộ tiền ăn.
Trong khi đó tại Chicago (Mỹ), Ramelio Hill, một học viên nghề hàn 18 tuổi, đã bán các cuộc trò chuyện điện thoại riêng tư với bạn bè và gia đình cho nền tảng huấn luyện AI hội thoại Neon Mobile với giá 0,5 USD mỗi phút. Tổng cộng, Hill thu về vài trăm USD.
“Các công ty công nghệ vốn đã thu thập quá nhiều dữ liệu cá nhân của tôi. Vậy thì tại sao tôi lại không được hưởng một phần lợi nhuận?”, Hill nói.
“Cơn sốt vàng dữ liệu” mới của thời AI
Những người như Louw, Tigga hay Hill đang nằm ở tuyến đầu của một “cơn sốt vàng dữ liệu” mới.
Khi các công ty công nghệ tại Thung lũng Silicon cần lượng dữ liệu khổng lồ để huấn luyện AI, họ đang ngày càng thiếu nguồn dữ liệu chất lượng cao có thể thu thập từ internet công khai. Điều này khiến một ngành công nghiệp mới xuất hiện: các “chợ dữ liệu” nơi người dùng bán dữ liệu cá nhân để huấn luyện AI.
Từ Cape Town đến Chicago, hàng nghìn người đang “cho thuê” danh tính số của mình, bao gồm giọng nói, hình ảnh, thói quen sinh hoạt và dữ liệu sinh trắc học – để phục vụ cho thế hệ AI tiếp theo.
Các nền tảng như Kled AI, Silencio hay Neon Mobile chỉ là một phần của hệ sinh thái đang phát triển nhanh chóng.
Một số nền tảng khác cũng tham gia vào thị trường này: Luel AI, được hỗ trợ bởi vườn ươm startup Y Combinator, thu thập các cuộc trò chuyện đa ngôn ngữ với giá khoảng 0,15 USD mỗi phút; ElevenLabs cho phép người dùng tạo bản sao giọng nói của mình và cấp quyền sử dụng với mức phí khoảng 0,02 USD mỗi phút.

Bouke Klein Teeselink, giáo sư kinh tế tại King’s College London, cho rằng huấn luyện AI kiểu “gig” đang trở thành một loại hình lao động mới và sẽ tiếp tục tăng trưởng mạnh. Theo ông, việc trả tiền cho người dùng để cấp phép dữ liệu giúp các công ty AI tránh rủi ro pháp lý liên quan đến bản quyền khi sử dụng nội dung thu thập từ internet.
“Dữ liệu con người hiện vẫn là tiêu chuẩn vàng để cải thiện hành vi của các mô hình AI”, nhà nghiên cứu AI Veniamin Veselovsky cho biết.
Công việc dễ kiếm tiền, nhưng nhiều rủi ro
Phần lớn những người tham gia công việc này đến từ các quốc gia đang phát triển – nơi tỷ lệ thất nghiệp cao và đồng nội tệ mất giá.
Đối với họ, được trả bằng USD thường hấp dẫn hơn nhiều so với các công việc địa phương. Tuy nhiên, những rủi ro của công việc này thường không dễ nhận ra ngay từ đầu.
Trong nhiều nền tảng, người dùng phải ký các thỏa thuận cấp phép dữ liệu không thể thu hồi và không có tiền bản quyền. Điều đó có nghĩa là một đoạn ghi âm giọng nói dài 20 phút hôm nay có thể được dùng để vận hành chatbot chăm sóc khách hàng trong nhiều năm, mà người cung cấp dữ liệu không nhận thêm bất kỳ khoản tiền nào.
Ngoài ra, do thiếu minh bạch trong các thị trường dữ liệu này, hình ảnh của một người có thể bị đưa vào hệ thống nhận diện khuôn mặt hoặc các quảng cáo lừa đảo ở nơi khác trên thế giới mà họ không hề biết.
Mark Graham, giáo sư địa lý internet tại Đại học Oxford và tác giả cuốn Feeding the Machine, cảnh báo rằng công việc này về bản chất bấp bênh và không mang lại triển vọng nghề nghiệp lâu dài.
Theo ông, các nền tảng dữ liệu thường dựa vào “cuộc đua giảm giá lao động”, trong khi nhu cầu dữ liệu con người chỉ mang tính tạm thời. “Khi nhu cầu này giảm đi, người lao động sẽ không còn sự bảo vệ, không có kỹ năng chuyển đổi và cũng không có mạng lưới an sinh”, Graham nói.
Khi dữ liệu cá nhân bị sử dụng ngoài tầm kiểm soát
Ramelio Hill – chàng trai bán các cuộc gọi điện thoại của mình cho Neon Mobile -cho biết anh từng có cảm giác không thoải mái khi làm điều đó.
Trong khoảng 11 giờ ghi âm cuộc gọi, anh kiếm được 200 USD. Tuy nhiên, ứng dụng thường xuyên gặp lỗi và chậm thanh toán.
Tháng 9 năm ngoái, Neon Mobile bất ngờ ngừng hoạt động sau khi phát hiện lỗ hổng bảo mật khiến bất kỳ ai cũng có thể truy cập số điện thoại, bản ghi cuộc gọi và bản chép lời của người dùng.
Hill cho biết anh chưa bao giờ được thông báo chính thức về sự cố này và hiện lo ngại giọng nói của mình có thể bị lạm dụng trên internet.
Jennifer King, nhà nghiên cứu quyền riêng tư dữ liệu tại Stanford, cho rằng điều đáng lo ngại là nhiều nền tảng AI không nói rõ dữ liệu người dùng sẽ được sử dụng ở đâu và như thế nào. “Nếu không hiểu rõ quyền của mình, người dùng có nguy cơ dữ liệu bị tái sử dụng theo những cách họ không mong muốn”, bà nói.
Các điều khoản sử dụng của nhiều nền tảng thậm chí cho phép công ty toàn quyền sử dụng dữ liệu, trên toàn cầu, vĩnh viễn và không cần trả thêm tiền.
Theo giáo sư luật Enrico Bonadio (Đại học City St George’s, London), điều đó đồng nghĩa với việc các công ty có thể làm “gần như bất cứ điều gì với dữ liệu đó mãi mãi”.
Một rủi ro khác là dữ liệu có thể bị dùng để tạo deepfake hoặc giả mạo danh tính, bởi các đặc điểm sinh trắc học như khuôn mặt hay giọng nói rất khó được ẩn danh hoàn toàn.
Hối tiếc sau khi bán danh tính số
Ngay cả những người ký hợp đồng chặt chẽ hơn cũng có thể cảm thấy hối tiếc.
Adam Coy, một diễn viên tại New York, đã bán quyền sử dụng hình ảnh và giọng nói của mình cho một công ty chỉnh sửa video AI với giá 1.000 USD. Hợp đồng quy định hình ảnh của anh không được sử dụng cho mục đích chính trị hoặc quảng bá rượu, thuốc lá và nội dung khiêu dâm.
Nhưng chỉ sau đó không lâu, bạn bè bắt đầu gửi cho anh những video lan truyền trên mạng có khuôn mặt và giọng nói của anh. Trong một video trên Instagram, bản sao AI của Coy thậm chí tự xưng là “bác sĩ phụ khoa” và quảng cáo các loại thực phẩm chức năng chưa được kiểm chứng.
“Thật khó khăn khi phải giải thích với mọi người”, Coy nói. “Những bình luận về ngoại hình của tôi rất kỳ lạ, vì thực ra đó không phải là tôi”.
Coy cho biết anh sẽ không tham gia bất kỳ công việc dữ liệu AI nào nữa, trừ khi được trả một khoản tiền rất lớn.
Kinh tế dữ liệu cá nhân: Khi thông tin cá nhân trở thành “tài sản số”
Sự bùng nổ của trí tuệ nhân tạo đang tạo ra một thị trường mới được gọi là “kinh tế dữ liệu cá nhân” (personal data economy) – nơi dữ liệu về con người trở thành tài nguyên có giá trị thương mại.
Trong mô hình này, người dùng có thể cấp phép sử dụng dữ liệu cá nhân như giọng nói, hình ảnh, hành vi trực tuyến hoặc dữ liệu sinh trắc học để các công ty công nghệ huấn luyện thuật toán AI.
Một số dạng dữ liệu đang được các nền tảng thu mua gồm:
– Giọng nói: dùng để huấn luyện trợ lý ảo và AI hội thoại
– Hình ảnh và video đời sống: phục vụ AI thị giác máy tính
– Âm thanh môi trường: giúp AI nhận diện bối cảnh thực tế
– Cuộc trò chuyện: cải thiện khả năng giao tiếp của chatbot
Dữ liệu sinh trắc học: phục vụ nhận diện khuôn mặt và giọng nói
Theo nhiều chuyên gia công nghệ, dữ liệu con người hiện được xem là nguồn tài nguyên quan trọng nhất trong kỷ nguyên AI. Tuy nhiên, việc thương mại hóa dữ liệu cá nhân cũng đặt ra nhiều câu hỏi về quyền riêng tư, quyền sở hữu danh tính số và mức độ kiểm soát của người dùng đối với thông tin của chính mình.
https%3A%2F%2F1thegioi.vn%2Fkiem-tien-bang-cach-ban-du-lieu-doi-song-ca-nhan-cho-ai-va-cai-gia-phai-tra-249603.html




