Thế Giới Bí ẩn Và đầy ám ảnh Của Những Người Huấn Luyện AI

Mô hình Trí tuệ nhân tạo (AI) là công nghệ làm nền tảng cho các chatbot đang được hàng trăm triệu người khắp thế giới sử dụng mỗi ngày và xem như đồng nghiệp, bạn bè, thậm chí là người yêu.

Trong quán cà phê nhỏ ở Istanbul (thủ đô Thổ Nhĩ Kỳ), nghệ sĩ Serhan Tekkılıç ngồi trước laptop, trò chuyện qua Zoom với một người bạn. Họ không bàn về nghệ thuật hay đời sống thường nhật, mà đang làm việc cho một dự án mang tên Xylophone, ghi lại các cuộc hội thoại bằng tiếng Thổ Nhĩ Kỳ để huấn luyện Grok – mô hình AI của công ty khởi nghiệp xAI do Elon Musk điều hành. Đằng sau những câu hỏi tưởng chừng vô nghĩa kiểu “Nếu trở thành một loại nhân pizza, bạn sẽ là gì?” là cả một ngành công nghiệp mới nổi: Đào tạo AI.

Tekkılıç tình cờ bước vào nghề này cuối năm 2023, khi sự nghiệp nghệ thuật chững lại vì anh bị trầm cảm. Nhờ chị gái giới thiệu, Tekkılıç đăng ký công việc huấn luyện AI cho nền tảng Outlier thuộc công ty khởi nghiệp Scale AI (đối tác của nhiều hãng công nghệ lớn). Công việc từ xa này không chỉ giúp Tekkılıç trang trải chi phí sinh hoạt mà còn đem lại thu nhập ổn định, có tuần lên đến 1.500 USD – khoản lớn ở Thổ Nhĩ Kỳ.

Thế giới bí mật, đầy ám ảnh của những người huấn luyện AI (2) — Khóa đào tạo AI đầu tiên mà Serhan Tekkılıç tham gia gồm 766 chủ đề thảo luận, từ tưởng tượng về cuộc sống trên sao Hỏa đến nhớ lại ký ức thời thơ ấu đầu tiên – Ảnh: Insider

Tekkılıç chỉ là một trong hàng trăm nghìn lao động ít ai biết đến nhưng rất quan trọng trong thời đại AI tạo sinh: Những người gán nhãn dữ liệu.

Công việc phía sau ánh hào quang AI

Người dùng toàn cầu ngày càng phụ thuộc vào chatbot, từ ChatGPT của OpenAI, Grok của xAI, Google Gemini đến Meta AI. Các chatbot AI này được kỳ vọng như đồng nghiệp, nhà trị liệu tâm lý, bạn bè hay thậm chí người tình ảo. Song để AI trò chuyện giống con người đến vậy, rất nhiều lao động trên khắp thế giới thực hiện những việc thầm lặng như đọc hàng trăm câu trả lời cho chatbot, phân loại xem câu nào hữu ích, lịch sự, tự nhiên; câu nào sai, lan man hay xúc phạm… Họ vừa giống chuyên viên ngôn ngữ trị liệu, vừa giống giáo viên dạy phép xã giao, vừa như huấn luyện viên tranh biện. Những đánh giá này giúp mô hình AI được tinh chỉnh qua kỹ thuật học tăng cường với phản hồi từ con người, từ đó định hình cách nó pha trò, tư vấn nghề nghiệp hoặc xử lý tình huống đạo đức.

Theo trang Insider, hiện có ít nhất hàng trăm nghìn người đang tham gia công việc huấn luyện AI. Một số kiếm được thu nhập tốt, nhưng nhiều người khác phải chấp nhận mức lương rẻ mạt, công việc bấp bênh, thậm chí đối diện nội dung gây ám ảnh tâm lý.

Cách gia nhập nghề huấn luyện AI

Phần lớn bắt đầu bằng việc săn tin tuyển dụng trên nền tảng LinkedIn, Reddit hoặc qua truyền miệng. Người mới thường phải đăng ký trên nhiều nền tảng cùng lúc để tăng cơ hội nhận được việc. Quy trình tuyển dụng thường khắt khe, yêu cầu kiểm tra lý lịch, ký giấy tờ bảo mật và làm các bài thi dài nhiều giờ. Ứng viên phải chứng minh kiến thức trong nhiều lĩnh vực như toán, sinh học, vật lý. Các bài kiểm tra đo cả độ chính xác lẫn tốc độ và hầu hết không trả tiền.

Một số người ví von công việc này như “con lừa quay vòng làm bơ”: Đơn điệu, lặp đi lặp lại, nhưng vẫn cần thiết để vận hành cả cỗ máy AI khổng lồ.

Những người kiếm được lương cao

Với nhiều người, công việc này là cơ hội đổi đời. Isaiah Kwong-Murphy, sinh viên Đại học Northwestern (Mỹ), ban đầu chỉ muốn kiếm thêm thu nhập khi đang học ngành kinh tế. Anh phải chờ 6 tháng mới nhận được nhiệm vụ đầu tiên từ Outlier. Nhưng rồi công việc đến dồn dập, từ ra đề thi kinh tế bậc đại học, đến cố tình gài bẫy để chatbot đưa ra nội dung độc hại như hướng dẫn chế ma túy hay phạm tội.

Trong giai đoạn cao điểm, Kwong-Murphy kiếm được 50 USD/giờ, làm việc 50 giờ/tuần, và chỉ trong nửa năm đã thu về hơn 50.000 USD. Nhờ số tiền đó, anh dễ dàng chuyển đến thành phố New York (Mỹ) và nhận công việc toàn thời gian tại công ty tư vấn quản lý chiến lược Boston Consulting Group sau khi tốt nghiệp.

Thế giới bí mật, đầy ám ảnh của những người huấn luyện AI (4)

Thế giới bí mật, đầy ám ảnh của những người huấn luyện AI (3) — Isaiah Kwong-Murphy đã nhận làm các dự án gán nhãn dữ liệu và kiếm được hơn 50.000 USD trong 6 tháng – Ảnh: Insider

Ở Guatemala, Leo Castillo (nhân viên quản lý khách hàng 40 tuổi) cũng tận dụng khả năng tiếng Anh và tiếng Tây Ban Nha để tham gia Outlier. Anh thường làm việc ban đêm sau khi vợ con ngủ. Với dự án Xylophone, anh được trả 8 USD cho mỗi 10 phút trò chuyện. Trung bình một đêm, Leo Castillo có thể kiếm gần 70 USD. Anh thừa nhận: “Người ta tranh nhau tham gia các cuộc trò chuyện này, vì làm càng nhiều thì được trả càng nhiều”.

Mặt tối: Bấp bênh, lương thất thường, nội dung gây ám ảnh

Tuy nhiên, công việc đó không hề ổn định, thù lao có thể thay đổi đột ngột. Kwong-Murphy từng chứng kiến mức lương giảm từ 50 USD xuống còn 15 USD/giờ mà không có lời giải thích rõ ràng. Leo Castillo bị tụt điểm đánh giá vì Outlier chuyển hình thức từ hội thoại 1-1 sang nhóm 3-4 người, khiến chất lượng công việc của anh bị ảnh hưởng do người khác làm không tốt.

Nhiều lao động cũng phải đối diện nội dung gây ám ảnh. Krista Pawloski, người phụ nữ 55 tuổi ở bang Michigan (Mỹ), đã làm gán nhãn dữ liệu từ năm 2006. Bà từng phải lọc những tweet phân biệt chủng tộc, kiểm duyệt hình ảnh nhạy cảm, hay thậm chí dụ chatbot tạo ra nội dung độc hại. Krista Pawloski nhớ lại: “Một lần tôi gần như bỏ qua một câu mang tính phân biệt chủng tộc vì không nhận ra nó. Nếu không tra Google, tôi đã vô tình đưa chủ nghĩa phân biệt vào hệ thống AI”.

Thế giới bí mật, đầy ám ảnh của những người huấn luyện AI (4)3 — Krista Pawloski thất vọng vì sự thiếu minh bạch từ phía khách hàng: “Chúng tôi không biết tại sao phải làm việc đó” – Ảnh: Insider

Tekkılıç cũng từng phải kiểm duyệt nội dung chatbot tạo ra “câu chuyện tình yêu” có yếu tố tình dục phản cảm. Anh nói: “Tôi vẫn còn tức giận khi nhớ lại đoạn chat đó”.

Lo ngại đạo đức và quyền riêng tư

Một trong những vấn đề lớn nhất là sự thiếu minh bạch. Người lao động không biết dữ liệu mình gắn nhãn sẽ được dùng để cải thiện tìm kiếm, phát triển sản phẩm dân sự, hay phục vụ mục đích giám sát và quân sự. Họ buộc phải ký thỏa thuận bảo mật, khiến mọi thắc mắc rơi vào im lặng.

James Oyange (28 tuổi, ở Kenya) từng làm cho hãng Appen với mức lương 2 USD/giờ. Anh phải nghe và ghi chép chi tiết các đoạn hội thoại để huấn luyện trợ lý ảo như Siri hay Alexa. Ngoài ra, nhiều dự án yêu cầu người tham gia chụp hàng chục bức ảnh khuôn mặt ở các góc khác nhau, thậm chí chụp ảnh trẻ em đang ngủ hay chơi ngoài trời. Oyange từ chối vì lo ngại dữ liệu cá nhân bị lạm dụng. Sau này, anh nói: “Nếu có thể quay lại, tôi sẽ khuyên bản thân đừng nhận loại công việc đó”.

Appen là công ty toàn cầu chuyên cung cấp dịch vụ, giải pháp về dữ liệu để huấn luyện và cải thiện các hệ thống AI. Họ đóng vai trò cầu nối giữa các hãng công nghệ lớn và lực lượng lao động toàn cầu khổng lồ gồm các nhân viên hợp đồng độc lập.

Các nhà nghiên cứu, như Jonas Valente tại Oxford Internet Institute, cảnh báo rằng phần lớn lao động gắn nhãn không hề biết dữ liệu mình cung cấp được xử lý và sử dụng ra sao – vấn đề không chỉ về bảo mật mà liên quan yếu tố đạo đức.

Oxford Internet Institute là trung tâm nghiên cứu và giảng dạy đa ngành thuộc Đại học Oxford (Anh), chuyên tập trung vào nghiên cứu tác động của internet và công nghệ kỹ thuật số với xã hội.

Những biến động từ các hãng công nghệ lớn

Tương lai của ngành huấn luyện AI cũng đầy bất ổn. Tháng 6.2024, Meta Platforms mua 49% cổ phần Scale AI (công ty mẹ của Outlier) với giá 14,3 tỉ USD. Ngay lập tức, cộng đồng làm việc tự do xôn xao vì bảng điều khiển trống trơn, dự án tạm ngưng. Google, OpenAI và xAI – những khách hàng lớn của Outlier – đồng loạt cắt giảm hoặc dừng hợp đồng vì sợ lộ dữ liệu mật về tay Meta Platforms.

Ngoài ra, các hãng công nghệ lớn ngày càng đưa việc huấn luyện AI về nội bộ. Sự xuất hiện của các mô hình suy luận mạnh mẽ hơn, như DeepSeek R1, o3 của OpenAI, Google Gemini 2.5, cũng khiến nhu cầu lao động phổ thông giảm mạnh. Các mô hình suy luận mới ít phụ thuộc vào học tăng cường với phản hồi từ con người, đồng nghĩa cần ít người gán nhãn dữ liệu hơn. Thay vào đó, các hãng bắt đầu tuyển chuyên gia có trình độ cao như bác sĩ, luật sư, nhà nghiên cứu, với mức lương từ 100 đến 160 USD/giờ.

Tương lai của người huấn luyện AI

Dù vậy, nhiều người tin rằng AI vẫn cần “con người trong vòng lặp”.

“Con người trong vòng lặp” là khái niệm để chỉ những người trực tiếp tham gia vào quá trình huấn luyện, kiểm soát hoặc ra quyết định cùng mô hình AI.

James Oyange nói: “AI sẽ không thể có gì mang tính cách mạng nếu không có con người cung cấp dữ liệu”.

Sau 6 tháng chứng kiến AI ngày càng thông minh, Kwong-Murphy tự hỏi: “Đến khi nào chúng ta sẽ không cần huấn luyện AI nữa? Khi nào con người sẽ bị thay thế hoàn toàn?”.

Từ khi dự án Outlier kết thúc, Tekkılıç quay lại với nghệ thuật. Anh sẵn sàng nhận thêm việc nếu có nhưng vẫn giữ một nỗi băn khoăn: “Điều khiến tôi buồn là AI đang len lỏi vào mọi mặt đời sống. Tôi vốn lạc quan về AI, nhưng vẫn muốn giữ cho đời thực chút gì thiêng liêng”.

Kiến tạo tương lai công nghệ hay bị chính AI thay thế?

Thế giới của những người huấn luyện AI vừa mang đến cơ hội kiếm tiền, vừa chất chứa bất ổn. Họ là mắt xích quan trọng giúp chatbot AI trò chuyện tự nhiên, trở nên hữu ích, nhưng lại làm công việc thầm lặng, ít ai biết tới.

Khi các hãng công nghệ lớn ngày càng mạnh tay tự động hóa và hướng tới nguồn nhân lực chuyên môn cao, lực lượng lao động này phải đối diện câu hỏi lớn: Liệu họ đang góp phần kiến tạo tương lai công nghệ, hay chỉ tạm thời lấp đầy một giai đoạn chuyển tiếp trước khi bị chính AI thay thế?

https%3A%2F%2F1thegioi.vn%2Fthe-gioi-bi-an-va-day-am-anh-cua-nhung-nguoi-huan-luyen-ai-237209.html

Thế giới bí ẩn và đầy ám ảnh của những người huấn luyện AI

Must read

Meta trả tiền thu hút ngôi sao Instagram, TikTok, YouTube đăng nội dung lên Facebook

Apple kiếm tỷ USD từ AI dù chưa có chiến lược rõ ràng, từ OpenAI đến Elon Musk đều phải lệ thuộc

Doanh nhân đứng sau 5 triệu cửa hàng online bứt phá thần tốc là ai?

Doanh nghiệp thương mại điện tử Trung Quốc đốt tiền để xuất ngoại

More articles

Latest article

Meta trả tiền thu hút ngôi sao Instagram, TikTok, YouTube đăng nội dung lên Facebook

Apple kiếm tỷ USD từ AI dù chưa có chiến lược rõ ràng, từ OpenAI đến Elon Musk đều phải lệ thuộc

Doanh nhân đứng sau 5 triệu cửa hàng online bứt phá thần tốc là ai?

Doanh nghiệp thương mại điện tử Trung Quốc đốt tiền để xuất ngoại

Seminar Toán học và Ứng dụng (SMA) lần thứ V tại NTTU: Từ “biết AI” đến “hiểu sâu và làm chủ AI” trong nghiên...

Về chúng tôi

Danh mục phổ biến

Lựa chọn

Meta trả tiền thu hút ngôi sao Instagram, TikTok, YouTube đăng nội dung lên Facebook

Apple kiếm tỷ USD từ AI dù chưa có chiến lược rõ ràng, từ OpenAI đến Elon Musk đều phải lệ thuộc