Tại sao tất cả Big Tech đều đang tự làm chip AI riêng, và điều đó có nghĩa gì với NVIDIA?

Đăng lúc 23:37 01.07.2026

Tháng 6 năm 2026, OpenAI công bố Jalapeño, con chip suy luận (inference chip) đầu tiên do chính họ thiết kế, hợp tác cùng Broadcom. Chi tiết làm mình chú ý nhất không phải là chip ra mắt, mà là thời gian: thiết kế xong trong 9 tháng, với sự trợ giúp của chính các mô hình AI của OpenAI. Một công ty phần mềm thuần túy, không có bộ phận phần cứng truyền thống, vừa hoàn tất một con chip trong chưa đầy một năm.

OpenAI không phải người đầu tiên. Và đó chính là điều đáng để bàn luận.

Không ai muốn phụ thuộc một nhà cung cấp duy nhất

Hãy nhìn danh sách: Apple tự làm chip AI từ năm 2017, Google từ năm 2015, Tesla xây Dojo từ 2021, SpaceX vận hành Colossus cho xAI từ 2024, và bây giờ là OpenAI với Jalapeño. Nếu chỉ một hoặc hai công ty làm điều này, có thể gọi đó là chiến lược riêng. Nhưng khi gần như toàn bộ các công ty AI hàng đầu đều làm cùng một việc, đó là tín hiệu của một sự dịch chuyển có hệ thống.

Nguyên nhân cốt lõi không phức tạp: NVIDIA đang nắm giữ khoảng 85-92% thị phần trong phân khúc phần cứng tăng tốc AI (AI accelerator). Ở mảng huấn luyện mô hình, con số đó còn vượt 90%. Khi một nhà cung cấp kiểm soát gần như toàn bộ nguồn cung của một tài nguyên thiết yếu, những người mua lớn nhất sẽ sớm nhận ra rủi ro: giá cao, thời gian chờ dài, và quan trọng hơn, lộ trình phát triển sản phẩm của bạn bị ràng buộc vào lộ trình của người khác.

Với Google hay Apple, điều đó không thể chấp nhận được về mặt chiến lược. Với OpenAI, công ty đang chuẩn bị IPO ở mức định giá 852 tỷ đô, thì đó là rủi ro kinh doanh cần được kiểm soát ngay.

Ai làm trước, ai làm sau

Google đã tự làm chip từ 2015

Google là người đi sớm nhất và cũng kiên nhẫn nhất. Bộ vi xử lý chuyên dụng (Tensor Processing Unit — TPU) đầu tiên của họ đã chạy bí mật trong các trung tâm dữ liệu của Google từ năm 2015, trước khi được công bố tại Google I/O năm 2016. Lý do ban đầu không phải là lo ngại về NVIDIA, thực ra NVIDIA lúc đó chưa thống trị AI theo cách họ làm hôm nay. Lý do là kinh tế học: Google nhận ra rằng với quy mô vận hành của mình, chip tự thiết kế cho đúng mục đích sẽ tiết kiệm đáng kể so với GPU đa năng. Năm 2026, Google đang vận hành thế hệ TPU thứ 8, với hai biến thể riêng biệt cho huấn luyện và suy luận.

Còn Apple cũng đẩy mạnh việc phát triển chip của riêng mình với A11 Bionic tích hợp Neural Engine

Apple đi theo hướng khác. Mục tiêu của Apple không phải là trung tâm dữ liệu mà là thiết bị cầm tay. Kể từ chip A11 Bionic ra mắt năm 2017, chiếc iPhone đầu tiên có bộ xử lý Neural Engine chuyên dụng, Apple đã dần tích hợp sâu hơn khả năng xử lý AI vào mọi chip họ tự thiết kế. Đến nay, toàn bộ dòng chip M và A đều có Neural Engine riêng, giúp Apple Intelligence chạy được ngay trên thiết bị mà không cần gửi dữ liệu lên đám mây, vốn là điều mà Apple gọi là "on-device AI" và xem là một lợi thế về quyền riêng tư.

Tesla bắt đầu từ một bài học đầy đau đớn. Năm 2016, Tesla dùng chip NVIDIA cho hệ thống hỗ trợ lái. Đến năm 2019, họ ra mắt chip tự thiết kế đầu tiên cho Autopilot và tuyên bố hiệu năng tốt hơn gấp nhiều lần chip thương mại với chi phí thấp hơn. Từ đó, Tesla tiếp tục đầu tư vào Dojo, siêu máy tính tự xây để huấn luyện các mô hình thị giác máy cho xe tự lái.

Làm chip riêng khó đến mức nào

Không phải ai cũng có thể làm được điều này. Chi phí thiết kế một con chip ở quy trình sản xuất tiên tiến hiện nay, 3nm hoặc 2nm, ước tính vào khoảng 500 triệu đến hơn 1 tỷ đô la chỉ riêng phần kỹ thuật, trước khi tính đến chi phí sản xuất và thử nghiệm. Thời gian từ thiết kế đến sản phẩm thực tế thường mất 2-3 năm, và rủi ro thất bại ở vòng thiết kế đầu tiên là rất thật, không ít công ty đã phải làm lại từ đầu sau khi nhận chip mẫu đầu tiên không đáp ứng yêu cầu.

Đây là lý do con số 9 tháng của OpenAI với Jalapeño đáng chú ý đến vậy. OpenAI thừa nhận rằng quá trình thiết kế được rút ngắn một phần nhờ dùng chính các mô hình AI của mình để tự động hóa nhiều bước trong quy trình kỹ thuật. Đây là lần đầu tiên mình thấy một công ty AI công khai nói rằng AI đã giúp họ làm phần cứng nhanh hơn: một vòng phản hồi thú vị mà sẽ ngày càng phổ biến.

Tuy nhiên, Jalapeño cũng thận trọng về phạm vi: đây là chip suy luận (inference), không phải chip huấn luyện (training). Suy luận là bước chạy mô hình để phục vụ người dùng thực tế, ít đòi hỏi hơn về mặt kỹ thuật so với huấn luyện, nhưng lại là bước tốn kém nhất về chi phí vận hành khi quy mô người dùng lớn như của OpenAI. Huấn luyện vẫn sẽ cần GPU NVIDIA trong nhiều năm tới.

NVIDIA sẽ cảm nhận điều này như thế nào

Thị phần 85-92% của NVIDIA trong phân khúc phần cứng AI nghe có vẻ vững chắc, nhưng mình chú ý hơn đến hướng dịch chuyển: từ đỉnh cao khoảng 87% năm 2024, con số đó được dự báo giảm xuống khoảng 75% trong năm 2026. Mức giảm đó không phải thảm họa, nhưng nó đang diễn ra trong bối cảnh tổng thị trường phần cứng AI đang bùng nổ từ 120 tỷ đô năm 2025 lên dự kiến hơn 200 tỷ đô. Nói đơn giản: NVIDIA mất một phần thị phần tương đối, nhưng doanh thu tuyệt đối vẫn tăng mạnh vì cái "bánh" đang to ra rất nhanh.

Không dễ để làm khó NVIDIA nhưng họ sẽ bị ảnh hưởng nhất định ở mảng Inference

Điểm mà NVIDIA thực sự dễ bị ảnh hưởng nhất là mảng suy luận tại các công ty vận hành quy mô siêu lớn, chính xác là nhóm đang tự làm chip. Khi ChatGPT, Gemini, hay Apple Intelligence phục vụ hàng trăm triệu người dùng mỗi ngày, chi phí suy luận tích lũy lại là con số khổng lồ. Đây là bài toán kinh tế đủ hấp dẫn để đầu tư vài trăm triệu đô vào chip riêng và thu hồi trong vài năm.

Còn với việc huấn luyện các mô hình ngôn ngữ lớn thế hệ tiếp theo, NVIDIA vẫn đang chiếm ưu thế gần như tuyệt đối vì đây là tác vụ đòi hỏi hiệu năng cao nhất và phần mềm hệ sinh thái (CUDA) của NVIDIA đang được tối ưu theo từng thế hệ trong suốt hai thập kỷ qua. Đó không phải lợi thế có thể sao chép trong vài năm.

Mình thấy bức tranh cuối cùng có lẽ là thế này: trong 3-5 năm tới, NVIDIA sẽ vẫn là nhà cung cấp không thể thiếu cho việc huấn luyện mô hình, nhưng sẽ mất dần thị phần trong phân khúc suy luận ở quy mô lớn, chính xác là nơi mà Apple, Google, OpenAI và các công ty khác đang đặt cược vào chip riêng của mình. Đó không phải là cái chết của NVIDIA. Nhưng đó là dấu hiệu cho thấy thị trường phần cứng AI đang trưởng thành: từ một nhà cung cấp duy nhất, nó đang tạo ra một hệ sinh thái đa cực — và cuộc cạnh tranh thực sự vẫn chưa bắt đầu.