24.8 C
Kwang Binh
spot_img
Thứ Ba, Tháng 4 29, 2025

AI thi trượt, thất bại trong bài kiểm tra trí tuệ của con người

Must read


Trí tuệ nhân tạo đang thay đổi thế giới, nhưng liệu nó đã đủ thông minh để vượt qua con người? Một bài kiểm tra mang tính bước ngoặt mang tên “Kỳ thi cuối cùng của nhân loại” (HLE) đã được thiết kế để trả lời câu hỏi đó. Và bất ngờ thay, dù sở hữu kho dữ liệu khổng lồ, các mô hình AI đình đám như ChatGPT hay Gemini vẫn bó tay trước thử thách này.

I. HLE – Bài thi khó nhất dành cho AI

Trí tuệ AI tham gia bài kiểm tra HLE (Nguồn: Internet)
Trí tuệ AI tham gia bài kiểm tra HLE (Nguồn: Internet)

HLE là kết quả của sự hợp tác giữa hai tổ chức ở hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – đại diện cho quan điểm kiểm soát và đảm bảo tính an toàn của AI trong xã hội, và Scale AI – công ty chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ lớn. Mục tiêu của họ là xác định ranh giới cuối cùng giữa trí tuệ nhân tạo và trí tuệ con người.

Không giống những bài kiểm tra thông thường, HLE không dựa vào khả năng xử lý ngôn ngữ hay phân tích văn bản đơn thuần. Nó bao gồm hơn 2.700 câu hỏi được gửi từ các chuyên gia trên toàn cầu, trải dài từ toán học, vật lý, hóa học, sinh học đến nhân văn, ngôn ngữ cổ và thậm chí cả triết học. Có câu hỏi yêu cầu dịch dòng chữ La Mã cổ, câu khác lại xoáy sâu vào cấu trúc sinh học của chim ruồi – những đề bài mà ngay cả con người cũng phải vất vả suy nghĩ.

II. AI “trượt” – Một thất bại đáng suy ngẫm

AI đã thi trượt kỳ kiểm tra vì đề bài quá khó (Nguồn: Internet)
AI đã thi trượt kỳ kiểm tra vì đề bài quá khó (Nguồn: Internet)

Kết quả ban đầu cho thấy: AI đã trượt toàn tập. Các mô hình tiên tiến như Gemini hay DeepSeek chỉ đạt 3-14% độ chính xác. Lý do chính là vì bài kiểm tra quá khó và không thể “lách luật” bằng việc tìm kiếm trên mạng. Mỗi câu hỏi đều có một đáp án duy nhất, không chấp nhận sự mơ hồ hay “vòng vo” thường thấy trong các mô hình ngôn ngữ lớn (LLM).

Việc chấm điểm được tự động hóa bằng GPT-40 – một AI khác đóng vai trò giám khảo, đảm bảo tính công bằng và nhất quán tuyệt đối. Để được công nhận, câu trả lời của AI phải đúng về bản chất, không chỉ đúng theo “cú pháp”.

III. Từ sai lầm đến hy vọng

Con người sẽ cần phải huấn luyện AI kỹ lưỡng hơn (Nguồn: Internet)
Con người sẽ cần phải huấn luyện AI kỹ lưỡng hơn (Nguồn: Internet)

Dù kết quả ban đầu có vẻ tệ hại, nhưng các chuyên gia không quá bi quan. Theo nhóm nghiên cứu, nếu tốc độ phát triển AI hiện tại được duy trì, các mô hình có thể đạt 50% câu trả lời đúng vào cuối năm 2025. Đây là cột mốc cho thấy AI đang từng bước tiến gần hơn đến ngưỡng cửa của hiểu biết con người.

Một điểm đáng chú ý trong giai đoạn tiếp theo của dự án là việc huấn luyện AI biết khi nào mình không chắc chắn. Thay vì luôn trả lời với độ tự tin 100% – dù có thể sai hoàn toàn – AI giờ sẽ phải đưa ra mức độ tin tưởng cho mỗi câu trả lời, tính theo phần trăm. Chỉ số này giúp giảm thiểu những sai sót nghiêm trọng trong các lĩnh vực nhạy cảm như y tế, pháp luật hay tài chính, nơi một sai lầm nhỏ cũng có thể dẫn đến hậu quả lớn.

IV. Khi AI đối diện giới hạn của chính mình

Trí tuệ nhân tạo sẽ phải cần thêm thời gian để nâng cấp “trình độ” (Nguồn: Internet)
Trí tuệ nhân tạo sẽ phải cần thêm thời gian để nâng cấp “trình độ” (Nguồn: Internet)

HLE không chỉ là một bài kiểm tra. Nó là một tấm gương soi để AI nhìn lại những giới hạn mà mình chưa thể vượt qua. Không còn là việc “học vẹt” từ hàng tỷ dữ liệu trên mạng, mà là thách thức khả năng lý luận, phân tích và tự nhận thức – những điều tưởng như chỉ con người mới có.

Thất bại lần này không có nghĩa AI yếu kém, mà là lời nhắc rằng trí tuệ nhân tạo vẫn cần thêm thời gian, sự kiểm soát và định hướng đúng đắn. Và nếu một ngày nào đó AI vượt qua được kỳ thi cuối cùng này, câu hỏi quan trọng sẽ không còn là “AI biết được gì?”, mà sẽ chuyển thành: Chúng ta còn giữ vai trò gì trong một thế giới mà AI đã thực sự hiểu biết?”

V. Kết luận

“Kỳ thi cuối cùng của nhân loại” đã hé lộ một sự thật thú vị: AI vẫn chưa thể thay thế hoàn toàn trí tuệ con người, ít nhất là ở thời điểm hiện tại. Nhưng con đường phía trước vẫn rộng mở. Sự thất bại của AI hôm nay có thể là nền tảng cho những bước tiến vượt bậc ngày mai. Và cuộc đua giữa trí tuệ tự nhiên và trí tuệ nhân tạo chắc chắn sẽ còn nhiều hồi hấp dẫn hơn nữa.

Hãy cùng Phong Vũ Tech News cập nhật thêm nhiều thông tin về công nghệ trí tuệ nhân tạo trong những bài viết khác tại blog Tin Tức nhé!

Bài viết liên quan:

Card màn hình VGA Nividia RTX 5070 Ti

https%3A%2F%2Fphongvu.vn%2Fcong-nghe%2Ftri-tue-nhan-tao-ai-thi-truot%2F

- Advertisement -spot_img

More articles

- Advertisement -spot_img

Latest article