DeepSeek chỉ đạt 17% độ chính xác, thấp hơn so với các chatbot AI khác
Đăng lúc
23:09 31.01.2025
Vào ngày 29/1/2025, trang tin Reuters đã dẫn lại báo cáo từ NewsGuard (tổ chức xếp hạng mức độ tin cậy của thông tin) cho thấy ứng dụng chatbot AIDeepSeek đến từ Trung Quốc chỉ đạt 17% độ chính xác khi trả lời các câu hỏi liên quan đến tin tức thời sự. NewsGuard đã xếp DeepSeek ở thứ hạng 10/11 trong các chatbot AI được đánh giá.
Liệt kê các chatbot AI và tiêu chí đánh giá của NewsGuard
Báo cáo từ NewsGuard cho biết họ đã đánh giá 11 chatbot AI phổ biến hiện tại bao gồm:
DeepSeek được xem là đối thủ cạnh tranh trực tiếp của ChatGPT cùng nhiều chatbot AI khác trên thị trường hiện tại (ảnh minh họa).
NewsGuard cũng cho biết họ đã sử dụng 300 câu hỏi giống nhau để hỏi DeepSeek và 10 chatbot AI còn lại. Trong đó, 30 câu hỏi được dựa trên 10 thông tin sai sự thật đang lan truyền trên mạng.
Kết quả báo cáo của NewsGuard
Kết quả từ NewsGuard cho biết DeepSeek lặp lại các thông tin sai sự thật trong 30% trường hợp và đưa ra câu trả lời mơ hồ hoặc không hữu ích ở 53% trường hợp. Điều này đồng nghĩa các thông tin thời sự được chatbot AI DeepSeek đưa ra có fail rate (tạm dịch: tỉ lệ sai lệch) lên đến ~83.33%.
NewsGuard cũng đưa ra tỉ lệ sai lệch của những chatbot AI còn lại nhưng họ chỉ đánh số thứ tự từ 1 đến 10 (không nêu tên gọi cụ thể). Tổ chức này chia sẻ tỉ lệ sai lệch trung bình của các chatbot đến từ phương Tây (bao gồm những đối thủ cạnh tranh trực tiếp với DeepSeek như ChatGPT, Gemini...) rơi vào ~62%.
Bảng kết quả cho thấy fail rate (tạm dịch: tỉ lệ sai lệch) của các chatbot AI khi đưa ra những thông tin thời sự. Nguồn: NewsGuard.
Bên cạnh đó, NewsGuard cho biết DeepSeek đưa ra những chủ đề sai sự thật liên quan đến vụ ám sát ông Brian Thompson (CEO của công ty bảo hiểm UnitedHealthcare) và chuyến bay của hãng hàng không Azerbaijan Airlines bị rơi tại Kazakhstan.
Chatbot AI DeepSeek dường như vẫn chưa hoàn thiện và đưa ra nhiều thông tin sai sự thật (ảnh minh họa). Nguồn: Business Standard.
Đáng chú ý là trong ~3/10 những câu hỏi bên trên, DeepSeek đã tự ý lồng quan điểm của Chính phủ Trung Quốc dù các câu hỏi không liên quan đến Trung Hoa và phần lệnh cũng không đề cập gì đến quốc gia này.
Tác giả Reuters chia sẻ kết quả từ NewsGuard khiến nhiều chuyên gia hoài nghi tuyên bố của DeepSeek rằng công nghệ AI của họ "tương đương hoặc vượt qua" OpenAI.
Reuters đã trích dẫn chia sẻ từ ông Gil Luria, chuyên gia phân tích tại D.A. Davidson: "The importance of the DeepSeek breakthrough is not in answering Chinese news-related question accurately, it is in the fact that it can answer any question at 1/30th of the cost of comparable AI models."
Tạm dịch: “Tầm quan trọng của bước đột phá DeepSeek không nằm ở việc trả lời tin tức Trung Quốc chính xác, mà ở chỗ nó có thể trả lời bất kỳ câu hỏi nào với chi phí chỉ bằng 1/30 so với các mô hình AI tương đương”.
DeepSeek hiện tại vẫn còn nhiều lỗ hổng và khiến các chuyên gia lo ngại về tính bảo mật (ảnh minh họa). Nguồn: The Wire China.
Tương tự phần lớn chatbot AI trên thị trường hiện tại, NewsGuard cho biết DeepSeek rất dễ bị khai thác để phát tán tin giả, đặc biệt là khi phản hồi các câu hỏi từ người dùng cố tình tìm cách tạo và lan truyền thông tin sai lệch.
Thông tin sơ bộ về chatbot AI DeepSeek
DeepSeek được ra mắt ngày 10/1/2025 và chatbot AI này đã nhanh chóng trở thành ứng dụng được tải xuống nhiều nhất trên kho ứng dụng của Apple. Điều này nhanh chóng dấy lên những lo ngại về việc Mỹ có thể đánh mất lợi thế dẫn đầu trong lĩnh vực AI. Trước sự vươn lên của DeepSeek, nhiều nhà đầu tư đã bán tháo các cổ phiếu công nghệ tại Mỹ, khiến giá trị vốn hóa ngành này sụt giảm nghiêm trọng.
DeepSeek hiện vẫn đứng đầu trong TOP 10 ứng dụng miễn phí được tải nhiều nhất trên App Store.
Theo trang tin tài chính Livemint (28/1/2025), thế giới tài chính vừa chứng kiến một cú sốc lớn khi nhóm 500 tỉ phú giàu nhất thế giới mất tổng cộng 108 tỉ USD (~2.708 tỉ đồng) chỉ trong một ngày, sau đợt bán tháo cổ phiếu công nghệ do ảnh hưởng từ startup AI Trung Quốc DeepSeek.
Vậy các bạn nhận xét như thế nào về việc chatbot AI DeepSeek đưa ra nhiều thông tin sai lệch hơn các chatbot AI khác? Bạn đang sử dụng chatbot AI nào? Hãy thực hiện bảng vote bên dưới và bình luận ở cuối bài viết để nêu lên quan điểm của bạn. Cảm ơn các bạn đã quan tâm và theo dõi.
Tham khảo: Reuters, NewsGuard, Livemint, Tinhte.vn.