OpenAI ra mắt GPT-5 – mô hình AI hợp nhất sẽ trở thành mặc định cho ChatGPT. Theo TechCrunch, GPT-5 kết hợp năng lực suy luận của dòng o-series với tốc độ phản hồi của dòng GPT, hướng tới trải nghiệm giống “tác tử” có thể thực hiện tác vụ thay người dùng như tạo ứng dụng phần mềm, điều phối lịch hay lập bản tóm tắt nghiên cứu.
Sam Altman khẳng định đây là “mô hình tốt nhất thế giới” và xem GPT-5 là bước tiến quan trọng trên lộ trình phát triển AGI – hệ thống có thể vượt con người ở phần lớn công việc mang giá trị kinh tế. Nick Turley, Phó chủ tịch ChatGPT, cho biết việc đưa GPT-5 làm mặc định cho người dùng miễn phí là cách để thực hiện mục tiêu phổ cập AI nâng cao.
Nâng cấp cốt lõi và trải nghiệm người dùng
GPT-5 được giới thiệu như mô hình hợp nhất với một bộ định tuyến thời gian thực để tự chọn chiến lược trả lời. Khi câu hỏi đơn giản, hệ thống ưu tiên tốc độ. Khi vấn đề phức tạp, GPT-5 chủ động “nghĩ” lâu hơn để gia tăng chất lượng, giúp người dùng không phải tự chỉnh cấu hình.
Trên nền tảng ChatGPT, GPT-5 hướng tới việc hoàn thành tác vụ trọn vẹn như sinh mã và dựng ứng dụng theo mô tả ngắn – cách làm mà cộng đồng gọi là “vibe coding”. Ngoài việc đưa GPT-5 thành mặc định cho người dùng miễn phí, gói Plus 20 USD mỗi tháng có hạn mức sử dụng cao hơn, còn gói Pro 200 USD mỗi tháng cung cấp truy cập không giới hạn cùng bản tăng cường tính toán GPT-5 Pro.
Các tổ chức dùng Team, Edu và Enterprise sẽ được chuyển sang GPT-5 vào tuần sau. Người dùng cũng có thể chọn bốn phong cách phản hồi sẵn có gồm Cynic, Robot, Listener và Nerd để định hình giọng điệu mà không cần nhắc đi nhắc lại.
OpenAI nhấn mạnh GPT-5 giảm ảo giác, chủ động gợi ý khi phát hiện rủi ro sức khỏe và phân biệt tốt hơn giữa mục đích sử dụng xấu và yêu cầu vô hại, từ đó tăng tính an toàn mà vẫn hạn chế từ chối nhầm.
Với nhà phát triển, GPT-5 xuất hiện trên API ở ba kích cỡ gpt-5, gpt-5-mini và gpt-5-nano tương ứng mức suy luận khác nhau. API còn cho phép điều khiển độ dài – độ chi tiết phản hồi. Giá tham khảo bản nền tảng là 1.25 USD cho mỗi 1 triệu token đầu vào và 10 USD cho mỗi 1 triệu token đầu ra.
Hiệu năng và ý nghĩa thực tiễn
Trên các phép đo công khai, GPT-5 cho thấy bức tranh cân bằng giữa tiến bộ rõ rệt và giới hạn theo ngữ cảnh. Ở bài SWE-bench Verified mô phỏng nhiệm vụ sửa lỗi từ GitHub, GPT-5 đạt 74.9% ngay lần thử đầu, nhỉnh hơn Claude Opus 4.1 (74.5%) và vượt Gemini 2.5 Pro (59.6%).
Với GPQA Diamond – câu hỏi khoa học mức tiến sĩ – GPT-5 Pro đạt 89.4%, cao hơn Claude Opus 4.1 (80.9%) và nhỉnh hơn Grok 4 Heavy (88.9%). Ở Humanity’s Last Exam – bài kiểm tra khó tổng hợp nhiều lĩnh vực, GPT-5 Pro đạt 42% khi dùng công cụ, thấp hơn Grok 4 Heavy đạt 44.4%.
Tại Tau-bench mô phỏng tác vụ web, GPT-5 đạt 63.5% khi điều hướng website hãng hàng không so với o3 đạt 64.8%. Trong khi đó, ở phần bán lẻ, GPT-5 đạt 81.1% so với Claude Opus 4.1 đạt 82.4%.
Về độ tin cậy, bài HealthBench Hard Hallucinations ghi nhận GPT-5 ở chế độ “nghĩ” có tỉ lệ ảo giác 1.6%. Trong thử nghiệm nội bộ với prompt ChatGPT, GPT-5 (khi “nghĩ”) trả lời sai 4.8%, giảm mạnh so với GPT-4o và o3.
Ý nghĩa thực tiễn của những con số này nằm ở chỗ GPT-5 đủ mạnh để chuyển từ “trả lời tốt” sang “làm việc được”. Doanh nghiệp có thể giao cho ChatGPT các đầu việc như phác thảo ứng dụng nội bộ, tạo quy trình xử lý tài liệu và lịch họp, hay tổng hợp báo cáo nghiên cứu.
Người dùng phổ thông được hưởng trải nghiệm đơn giản hơn nhờ router tự động, đồng thời có sự bảo vệ tốt hơn ở tình huống liên quan sức khỏe. TechCrunch cũng nhắc lại quy mô của ChatGPT đã đạt hơn 700 triệu người dùng mỗi tuần, cho thấy tác động của việc đưa GPT-5 thành mặc định có thể rất lớn trên thực tế.
Trong bối cảnh cạnh tranh, TechCrunch coi GPT-5 là thước đo tiến bộ của toàn ngành. Mô hình này đặt chuẩn mới ở mảng coding và độ tin cậy trong một số kịch bản, dù chưa vượt trội toàn diện ở mọi tác vụ web.
Ngay trước thời điểm ra mắt, OpenAI phát hành gpt-oss – mô hình suy luận mở trọng lượng – để doanh nghiệp và lập trình viên có thêm lựa chọn chi phí thấp. GPT-5 tiếp tục đảm nhiệm vai trò đầu tàu hiệu năng.
Kết luận quan trọng là benchmark chỉ phản ánh một phần. Giá trị thực sẽ đến từ cách GPT-5 được đóng gói vào sản phẩm, từ guardrail an toàn cho tới chuỗi tác vụ nhiều bước, nơi router thời gian thực và khả năng “nghĩ” có thể tạo khác biệt so với thế hệ trước.
https%3A%2F%2Fcongngheviet.com%2Fgpt-5-ra-mat-mo-hinh-ai-hop-nhat-thong-minh-hon-it-ao-giac-hon%2F