Theo công bố chính thức từ DeepSeek, R1 chỉ tốn 5.6 triệu USD để phát triển. Con số này đối với một mô hình do một startup Mỹ tạo ra, theo lời của CEO Dario Amodei từ Anthropic, là từ 100 triệu tới 1 tỷ USD!
Barrett Woodside, đồng sáng lập Position, startup phần cứng xử lý AI có trụ sở tại San Francisco, anh và các đồng nghiệp đang bị ngợp với DeepSeek: “Họ thực sự ấn tượng,” nói tới thực tế là mô hình R1 hay V3 của DeepSeek thực tế là những mô hình mã nguồn mở, source code phần mềm, nền móng của mô hình AI sẽ được cung cấp miễn phí cho tất cả mọi người.
Tháng 12/2024, DeepSeek V3 chính thức ra mắt, và ngay lập tức người dùng thử nghiệm mô hình này nhận ra, chatbot dựa trên V3 có những hàng rào kiểm duyệt giống hệt những gì OpenAI làm với ChatGPT, hay Google với Gemini, chỉ khác là AI của Trung Quốc coi những chủ đề về chính luận, đối nội và đối ngoại của đất nước này là những chủ đề nhạy cảm, chatbot không trả lời câu hỏi của người dùng.
Nhưng vì là một mô hình mã nguồn mở, hàng rào này hoàn toàn có thể bị gỡ bỏ, theo lời của Woodside.
Như đã nói, trên Chatbot Arena, nền tảng do các nhà nghiên cứ thuộc đại học Berkeley, California vận hành và tổng hợp benchmark, cả R1 lẫn V3 đều hiện diện trong top 10 mô hình ngôn ngữ mạnh nhất. Ở vị trí đầu tiên là một mô hình trong thế hệ Gemini của Google. Còn mô hình của DeepSeek thì nằm trên cả Claude của Anthropic lẫn Grok của xAI, startup do Elon Musk sáng lập.