Một nhà nghiên cứu thị trường nói rằng: “Kimi đang làm rất tốt nhiệm vụ và chức năng của nó, đặc biệt là ở giao diện người dùng, và phân tích ngữ cảnh của văn bản đầu vào thông qua tính năng RAG, truy xuất tạo sinh tăng cường.” Kỹ thuật RAG, viết tắt của retrieval-augmented generation cho phép các mô hình AI lấy dữ liệu từ nguồn bên ngoài, rồi tạo ra những kết quả trả lời với thông tin có tính cập nhật nhanh nhất phục vụ người dùng.
Tuy nhiên Kimi lại phải đối mặt với chính sự phổ biến của nó, khi máy chủ không chịu nổi cường độ vận hành để phục vụ hàng chục triệu người dùng mỗi tháng. Họ đến với chatbot Kimi nhờ giao diện dễ sử dụng, và nhờ những lời khen ngợi hết mức của các chuyên gia công nghệ đối với khả năng tóm tắt văn bản, tạo ra những câu trả lời ngắn gọn đúng trọng tâm. Hồi tháng 3, máy chủ vận hành Kimi bị quá tải, dịch vụ bị gián đoạn 2 ngày, khiến Moonshot phải gửi lời xin lỗi tới người dùng.
Đối mặt với áp lực hiệu năng xử lý điện toán quá lớn để vận hành chatbot AI dựa trên LLM như Kimi của Moonshot, một vài đơn vị khác chọn cách vận hành chatbot avatar với những nhân vật được nhiều người yêu mến. Trò chuyện với mấy chatbot này đơn giản hơn, không cần sức mạnh xử lý rất lớn để mô hình LLM có thể tư duy lý luận. Những chatbot avatar để mọi người chat giải trí cũng chỉ cần được huấn luyện dựa trên lượng dữ liệu tương đối thấp, và vận hành cũng đơn giản hơn nhờ tham số nội suy thấp.
Chưa có giải pháp và đơn vị nào nổi bật hẳn
Một nhà nghiên cứu AI tại Trung Quốc nói: “Copy ChatGPT rất khó. Mô hình chính là sản phẩm. Tạo những chatbot avatar giải trí dễ hơn, có khi chỉ cần một mô hình mã nguồn mở và lượng dữ liệu chỉ cần ở mức tương đối, rồi hiệu năng máy chủ vận hành cũng không cần quá cao.”
Cả Zhipu lẫn MiniMax đều có chatbot vận hành bằng AI, mô phỏng cách nói chuyện của những nhân vật manga và anime được nhiều người yêu thích. Chính những câu hỏi và câu trả lời của người dùng và AI lại được thu thập để hoàn thiện mô hình ngôn ngữ sau này.