Điểm mà NVIDIA thực sự dễ bị ảnh hưởng nhất là mảng suy luận tại các công ty vận hành quy mô siêu lớn, chính xác là nhóm đang tự làm chip. Khi ChatGPT, Gemini, hay Apple Intelligence phục vụ hàng trăm triệu người dùng mỗi ngày, chi phí suy luận tích lũy lại là con số khổng lồ. Đây là bài toán kinh tế đủ hấp dẫn để đầu tư vài trăm triệu đô vào chip riêng và thu hồi trong vài năm.
Còn với việc huấn luyện các mô hình ngôn ngữ lớn thế hệ tiếp theo, NVIDIA vẫn đang chiếm ưu thế gần như tuyệt đối vì đây là tác vụ đòi hỏi hiệu năng cao nhất và phần mềm hệ sinh thái (
CUDA) của NVIDIA đang được tối ưu theo từng thế hệ trong suốt hai thập kỷ qua. Đó không phải lợi thế có thể sao chép trong vài năm.
Mình thấy bức tranh cuối cùng có lẽ là thế này: trong 3-5 năm tới, NVIDIA sẽ vẫn là nhà cung cấp không thể thiếu cho việc huấn luyện mô hình, nhưng sẽ mất dần thị phần trong phân khúc suy luận ở quy mô lớn, chính xác là nơi mà Apple, Google, OpenAI và các công ty khác đang đặt cược vào chip riêng của mình. Đó không phải là cái chết của NVIDIA. Nhưng đó là dấu hiệu cho thấy thị trường phần cứng AI đang trưởng thành: từ một nhà cung cấp duy nhất, nó đang tạo ra một hệ sinh thái đa cực — và cuộc cạnh tranh thực sự vẫn chưa bắt đầu.