DeepSeek chỉ đạt 17% độ chính xác, thấp hơn so với các chatbot AI khác

Liệt kê các chatbot AI và tiêu chí đánh giá của NewsGuard

Báo cáo từ NewsGuard cho biết họ đã đánh giá 11 chatbot AI phổ biến hiện tại bao gồm:

DeepSeek

OpenAI ChatGPT-4o

You.com Smart Assistant

xAI Grok

Inflection Pi

Mistral le Chat

Microsoft Copilot

Meta AI

Anthropic Claude

Google Gemini 2.0

Perplexity answer engine.

DeepSeek được xem là đối thủ cạnh tranh trực tiếp của ChatGPT cùng nhiều chatbot AI khác trên thị trường hiện tại (ảnh minh họa).

NewsGuard cũng cho biết họ đã sử dụng 300 câu hỏi giống nhau để hỏi DeepSeek và 10 chatbot AI còn lại. Trong đó, 30 câu hỏi được dựa trên 10 thông tin sai sự thật đang lan truyền trên mạng.

Kết quả báo cáo của NewsGuard

Kết quả từ NewsGuard cho biết DeepSeek lặp lại các thông tin sai sự thật trong 30% trường hợp và đưa ra câu trả lời mơ hồ hoặc không hữu ích ở 53% trường hợp. Điều này đồng nghĩa các thông tin thời sự được chatbot AI DeepSeek đưa ra có fail rate (tạm dịch: tỉ lệ sai lệch) lên đến ~83.33%.

NewsGuard cũng đưa ra tỉ lệ sai lệch của những chatbot AI còn lại nhưng họ chỉ đánh số thứ tự từ 1 đến 10 (không nêu tên gọi cụ thể). Tổ chức này chia sẻ tỉ lệ sai lệch trung bình của các chatbot đến từ phương Tây (bao gồm những đối thủ cạnh tranh trực tiếp với DeepSeek như ChatGPT, Gemini...) rơi vào ~62%.

Bảng kết quả cho thấy fail rate (tạm dịch: tỉ lệ sai lệch) của các chatbot AI khi đưa ra những thông tin thời sự. Nguồn: NewsGuard.

Bên cạnh đó, NewsGuard cho biết DeepSeek đưa ra những chủ đề sai sự thật liên quan đến vụ ám sát ông Brian Thompson (CEO của công ty bảo hiểm UnitedHealthcare) và chuyến bay của hãng hàng không Azerbaijan Airlines bị rơi tại Kazakhstan.

Chatbot AI DeepSeek dường như vẫn chưa hoàn thiện và đưa ra nhiều thông tin sai sự thật (ảnh minh họa). Nguồn: Business Standard.

Đáng chú ý là trong ~3/10 những câu hỏi bên trên, DeepSeek đã tự ý lồng quan điểm của Chính phủ Trung Quốc dù các câu hỏi không liên quan đến Trung Hoa và phần lệnh cũng không đề cập gì đến quốc gia này.

Thông tin sơ bộ về chatbot AI DeepSeek

DeepSeek được ra mắt ngày 10/1/2025 và chatbot AI này đã nhanh chóng trở thành ứng dụng được tải xuống nhiều nhất trên kho ứng dụng của Apple. Điều này nhanh chóng dấy lên những lo ngại về việc Mỹ có thể đánh mất lợi thế dẫn đầu trong lĩnh vực AI. Trước sự vươn lên của DeepSeek, nhiều nhà đầu tư đã bán tháo các cổ phiếu công nghệ tại Mỹ, khiến giá trị vốn hóa ngành này sụt giảm nghiêm trọng.