Khoa học - Công nghệ

NVIDIA cảnh báo về bước ngoặt trong lĩnh vực trí tuệ nhân tạo

Nguyễn Thúc Hoàng Linh 19/03/2025 - 12:01

Tại hội nghị phát triển trí tuệ nhân tạo (AI) NVIDIA GTC tại San Jose (California, Mỹ), Giám đốc điều hành Jensen Huang nhấn mạnh, hãng bán dẫn hàng đầu thế giới đã sẵn sàng đón nhận những bước ngoặt đang xảy ra trong ngành công nghiệp AI.

nvidia_2.jpg
Hội nghị GTC 2025 diễn ra tại Mỹ từ nay tới hết ngày 21-3. Ảnh: NVIDIA

Phát biểu ngày 19-3 (giờ Việt Nam), nhà sáng lập NVIDIA nhấn mạnh, hiện nay các doanh nghiệp trong lĩnh vực AI đang chuyển từ đào tạo các mô hình AI sang giai đoạn khai thác những câu trả lời chi tiết từ chúng.

Tuy nhiên, ông Jensen Huang khẳng định, NVIDIA vẫn đảm bảo vị trí dẫn đầu trong cung cấp các bộ xử lý AI, dù điều này gần đây vấp phải hoài nghi từ các nhà đầu tư sau khi DeepSeek (Trung Quốc) giới thiệu chatbot với tính năng cạnh tranh nhưng không đòi hỏi nhiều về năng lực phần cứng AI.

"Khối lượng tính toán lúc này cần cho lý luận của AI tăng hơn 100 lần so với những gì chúng ta nghĩ rằng mình cần ở thời điểm này năm ngoái", ông Jensen Huang cho biết, nhấn mạnh đến các tác nhân AI tự động yêu cầu ít sự can thiệp của con người khi xử lý các nhiệm vụ thông thường.

Các loại chip của NVIDIA đang đối mặt áp lực từ những thay đổi công nghệ khi thị trường AI chuyển từ "đào tạo" (huấn luyện các mô hình AI như chatbot trên kho dữ liệu khổng lồ để làm cho chúng trở nên thông minh) sang "suy luận" (mô hình tự sử dụng trí thông minh để cung cấp câu trả lời cho người dùng).

nvidia_3.jpg
Nhà sáng lập, Giám đốc điều hành NVIDIA giới thiệu các nền tảng AI mới tại GTC 2025. Ảnh: NVIDIA

Cũng tại hội nghị năm nay, ông Jensen Huang đã công bố các chip mới của NVIDIA, bao gồm chip đồ họa (GPU) Blackwell Ultra, dự kiến có mặt vào nửa cuối năm nay.

Với nhiều bộ nhớ hơn so với thế hệ Blackwell hiện tại, Blackwell Ultra được kỳ vọng có thể hỗ trợ các mô hình AI lớn hơn.

Hiện nay, bộ xử lý AI có hai mục đích chính: Giúp các hệ thống AI phản hồi thông minh với một số lượng lớn người dùng, và đưa ra những phản hồi đó càng nhanh, càng tốt. Theo lãnh đạo hãng bán dẫn Mỹ, chip NVIDIA là giải pháp duy nhất có thể làm được cả hai việc này một cách tối ưu.

Ông Jensen Huang cũng tiết lộ chi tiết về thế hệ chip mới có tên Vera Rubin, kế nhiệm Blackwell và có tốc độ nhanh hơn. Vera Rubin sẽ được tung ra thị trường vào nửa cuối năm 2026.

GTC 2025 cũng chứng kiến mô hình máy chủ mới - dự kiến ra mắt năm 2027 - tích hợp hàng trăm chip Vera Rubin Ultra, tiêu thụ điện ở mức tới 600 kilowatt. Mức này tăng vọt so với hệ thống hàng đầu của NVIDIA hiện nay (72 chip, tiêu thụ khoảng 120 kilowatt).

Sau đó, NVIDIA sẽ phát triển chip Feynman cho giai đoạn năm 2028.

Nỗ lực đẩy nhanh việc tung ra các thế hệ chip mới của NVIDIA khá dễ hiểu, sau khi Blackwell xuất hiện chậm hơn dự kiến do sơ suất trong khâu thiết kế dẫn đến nhiều vấn đề về sản xuất.

Hệ quả là, ngành công nghiệp AI suốt năm 2024 đã phải vật lộn với sự chậm trễ, trong đó các phương pháp cung cấp dữ liệu bằng cách xây dựng những trung tâm dữ liệu lớn chứa đầy chip NVIDIA đã bắt đầu suy giảm lợi nhuận.

nvidia_4.jpg
Nhiều nền tảng AI phổ biến hiện nay dựa vào phần cứng NVIDIA. Ảnh: NVIDIA

Trong GTC 2025, NVIDIA cũng đề cập tới máy tính cá nhân thế hệ mới DGX Workstation dựa trên chip Blackwell. Các hệ thống này sẽ do Dell, Lenovo và HP, cùng nhiều hãng khác sản xuất. Đây được xem là đối thủ thách thức các máy tính Mac cao cấp của Apple trong lĩnh vực AI.

Bên cạnh đó, NVIDIA cũng phát hành miễn phí phần mềm mới có tên Dynamo, nhằm tăng tốc quá trình suy luận của các mô hình AI.