Chip AI Blackwell của Nvidia, được công bố vào tháng Ba năm nay, đang gặp phải sự cố quá nhiệt trên các máy chủ, khiến một số khách hàng lo ngại về thời gian triển khai các trung tâm dữ liệu mới. Sự cố này đã dẫn đến những thay đổi kỹ thuật lớn trong thiết kế tủ máy chủ, làm ảnh hưởng đến các kế hoạch ban đầu của Nvidia và các đối tác lớn. Để tìm hiểu chi tiết hơn, hãy theo dõi bài viết sau cùng Phong Vũ Tech News bạn nhé!
Vấn đề quá nhiệt ảnh hưởng đến khả năng vận hành
Theo The Information đưa tin ngày 18/11, chip GPU Blackwell đã xảy ra hiện tượng tăng nhiệt quá mức khi được vận hành trong tủ máy chủ với thiết kế chứa đến 72 chip. Điều này khiến Nvidia phải yêu cầu các nhà cung cấp liên tục thay đổi cấu trúc của tủ máy chủ nhằm giải quyết vấn đề.
Nguồn tin nội bộ cho biết, Nvidia đã nhận phản hồi từ kỹ sư nội bộ và các khách hàng lớn để điều chỉnh thiết kế phù hợp. Tuy nhiên, sự cố này đang đặt ra thách thức không nhỏ cho các công ty lớn như Meta Platforms (Facebook), Google (Alphabet) và Microsoft, vốn dự kiến sử dụng Blackwell để vận hành các trung tâm dữ liệu AI của họ.
Nvidia lên tiếng trấn an khách hàng
Một phát ngôn viên của Nvidia đã tuyên bố rằng công ty đang hợp tác chặt chẽ với các nhà cung cấp dịch vụ đám mây và đội ngũ kỹ thuật để giải quyết triệt để vấn đề nhiệt độ. Nvidia cho rằng những thay đổi kỹ thuật như vậy là bình thường và nằm trong kế hoạch dự phòng ban đầu.
Dù vậy, việc trì hoãn kế hoạch ra mắt dòng chip Blackwell từ quý II/2024 đã gây ảnh hưởng lớn đến các dự án của khách hàng. Sản phẩm này được kỳ vọng là bước đột phá trong xử lý đồ họa và Trí tuệ nhân tạo, với khả năng tăng hiệu suất xử lý lên đến 30 lần so với các dòng chip trước đó, đặc biệt trong các ứng dụng như chatbot AI.
Dòng chip Blackwell với thiết kế hai ô silicon liên kết đã được Nvidia giới thiệu là sản phẩm tiên phong trong các ứng dụng AI đòi hỏi sức mạnh tính toán cao. Tuy nhiên, vấn đề nhiệt độ hiện tại có thể làm giảm uy tín của Nvidia trong mắt các đối tác lớn.
Kết luận
Sự cố quá nhiệt của chip Blackwell là một bài học lớn cho Nvidia trong việc phát triển và triển khai các sản phẩm công nghệ tiên tiến. Công ty cần nhanh chóng khắc phục vấn đề để đảm bảo tiến độ của các dự án quan trọng. Nếu vượt qua được thách thức này, Blackwell vẫn có thể giữ vị thế là sản phẩm dẫn đầu trong lĩnh vực AI và xử lý đồ họa trên toàn cầu.
https%3A%2F%2Fphongvu.vn%2Fcong-nghe%2Fchip-ai-moi-cua-nvidia-gap-su-co%2F