27.5 C
Kwang Binh
spot_img
Thứ Ba, Tháng 4 29, 2025

AI đột phá với chi phí thấp hơn GPT-4 đến 97%

Must read


Tin đồn về mô hình Trí tuệ nhân tạo (AI) mới của DeepSeek, được gọi là DeepSeek R2, đang lan truyền mạnh mẽ trên mạng, hứa hẹn sẽ mang đến một bước tiến lớn trong lĩnh vực Trí tuệ nhân tạo AI với chi phí thấp đáng kinh ngạc và được huấn luyện hoàn toàn trên chip Ascend của Huawei. Hãy cùng Phong Vũ Tech News tìm hiểu chi tiết trong bài viết bên dưới!

DeepSeek R2 sắp ra mắt?

Sau thành công của mô hình R1, DeepSeek đã chứng minh rằng Trung Quốc không hề thua kém trong việc phát triển các mô hình AI cao cấp. Sự ra mắt của R1 không chỉ khiến thị trường chứng khoán Mỹ mất hàng tỷ USD giá trị mà còn cho thấy việc phát triển AI không đòi hỏi chi phí khổng lồ như những gì các công ty như OpenAI từng công bố. Giờ đây, các nguồn tin từ Trung Quốc bắt đầu rộ lên về mô hình DeepSeek R2, và có thể nói rằng thị trường AI phương Tây có thể sẽ phải đối mặt với một bước tiến bất ngờ khác từ Trung Quốc.

Tuy nhiên, cần lưu ý rằng những thông tin này vẫn chỉ là tin đồn và DeepSeek chưa xác nhận chính thức các con số liên quan đến R2. Theo Wccftech, DeepSeek R2 được cho là sẽ sử dụng kiến trúc MoE (Mixture of Experts) lai, một phiên bản nâng cấp của MoE hiện tại, có thể tích hợp các cơ chế gating tiên tiến hoặc kết hợp giữa MoE và các tầng dày đặc (dense layers) để tối ưu hóa các tác vụ đòi hỏi hiệu năng cao. Với kiến trúc này, R2 được cho là sở hữu số lượng tham số gấp đôi R1, đạt 1,2 nghìn tỷ tham số.

DeepSeek R2 sắp ra mắt?
DeepSeek R2 sắp ra mắt? (Nguồn: Internet)

Hiệu năng cạnh tranh và chi phí đột phá

Với số lượng tham số khổng lồ, DeepSeek R2 được cho là có khả năng cạnh tranh trực tiếp với GPT-4 Turbo của OpenAI và Gemini 2.0 Pro của Google. Nhưng điều khiến R2 thực sự nổi bật không chỉ nằm ở hiệu năng. Báo cáo cho biết chi phí mỗi token của DeepSeek R2 thấp hơn 97,4% so với GPT-4, với mức giá chỉ 0,07 USD cho mỗi triệu token đầu vào và 0,27 USD cho mỗi triệu token đầu ra. So với mức giá của OpenAI, R2 sẽ là lựa chọn cực kỳ tiết kiệm cho các doanh nghiệp, trở thành mô hình AI hiệu quả về chi phí nhất trên thị trường. Sự ra mắt của R2 có thể đánh dấu một bước ngoặt trong lĩnh vực AI và kinh tế liên quan đến nó.

Một số thông tin được hé lộ về DeepSeek R2
Một số thông tin được hé lộ về DeepSeek R2 (Nguồn: Internet)

Tận dụng tối đa GPU Huawei

Một điểm đáng chú ý khác là DeepSeek R2 được cho là đạt mức sử dụng 82% cụm chip Ascend 910B của Huawei, với sức mạnh tính toán lên đến 512 PetaFLOPS ở độ chính xác FP16. Điều này cho thấy DeepSeek đã quyết định sử dụng hoàn toàn tài nguyên nội bộ để huấn luyện mô hình chủ lực tiếp theo của mình. Trước đây, chúng ta đã biết DeepSeek rất quan tâm đến chip AI của Huawei, và việc huấn luyện R2 bằng thiết bị nội bộ cho thấy công ty này đã “tích hợp dọc” chuỗi cung ứng AI, từ phát triển đến triển khai.

Các thông tin về DeepSeek R2 hiện vẫn mang tính suy đoán, và sản phẩm cuối cùng có thể khác so với những gì được đồn đại. Tuy nhiên, dựa trên những gì các nguồn tin Trung Quốc tiết lộ, DeepSeek R2 hứa hẹn sẽ là một “đại địa chấn” khác cho các công ty AI chủ đạo trên thế giới.

Tận dụng tối đa GPU Huawei
Tận dụng tối đa GPU Huawei (Nguồn: Internet)

Bài viết liên quan:

Card màn hình VGA Nividia RTX 5070 Ti

https%3A%2F%2Fphongvu.vn%2Fcong-nghe%2Fdeepseek-r2-sap-ra-mat%2F

- Advertisement -spot_img

More articles

- Advertisement -spot_img

Latest article