DeepSeek bị phát hiện lộ dữ liệu trò chuyện của người dùng
Đăng lúc
23:07 31.01.2025
Trong bài blog vào ngày 30/1/2025, Wiz (một công ty chuyên về an ninh mạng của Mỹ) đã phát hiện một kho dữ liệu quan trọng của DeepSeek vô tình bị lộ trên Internet. Thông tin này cũng được trang Reuters dẫn lại.
Thông tin về việc DeepSeek để lộ dữ liệu cá nhân
Cụ thể, Wiz cho biết DeepSeek đã để hơn một triệu dòng dữ liệu không có biện pháp bảo mật bao gồm các khóa phần mềm kỹ thuật số và nhật ký trò chuyện dường như được ghi lại (nhật ký trò chuyện là các yêu cầu được gửi từ người dùng đến chatbotAI). DeepSeek hiện chưa đưa ra phản hồi về bài đăng của Wiz.
Công ty Wiz tìm thấy một số dữ liệu liên quan đến DeepSeek. Nguồn: Wiz.
Trang Reuters đã trích dẫn lại lời từ Ami Luttwak (Giám đốc công nghệ của Wiz) cho biết DeepSeek đã nhanh chóng có biện pháp bảo mật dữ liệu sau khi công ty của ông cảnh báo họ: "They took it down in less than an hour. But this was so simple to find we believe we're not the only ones who found it."
Tạm dịch: "Họ (DeepSeek) đã gỡ bỏ các dữ liệu trong vòng chưa đầy một giờ nhưng nguồn dữ liệu này dễ tìm đến nỗi tôi không chắc chúng tôi (Wiz) là người đầu tiên hoặc duy nhất phát hiện ra."
Chân dung ông Ami Luttwak - Giám đốc công nghệ của Wiz. Nguồn: Clay.
Trang Reuters chia sẻ thêm DeepSeek (mô hình AI mang tính đột phá của Trung Quốc) đang làm khuynh đảo thế giới công nghệ những ngày qua, vượt qua các đối thủ nổi tiếng như ChatGPT, Gemini và Claude AI trong một số bài kiểm tra. Công ty được đánh giá cao bởi chi phí nghiên cứu thấp hơn nhiều các ông lớn trong ngành cũng như thời gian phát triển ngắn.
Các bạn có thể đọc thêm bài viết này để biết được nhiều thông tin chi tiết liên quan đến DeepSeek.
Bên cạnh vụ việc để lộ dữ liệu ở trên, chatbot AI DeepSeek còn vướng phải nhiều vấn đề khác như sau:
Sử dụng mô hình độc quyền của OpenAI để đào tạo AI
Theo thông tin từ Bloomberg (29/1/2025), trong quá trình OpenAI và Microsoft điều tra về DeepSeek, các nhà nghiên cứu của họ phát hiện rằng một lượng lớn dữ liệu của DeepSeek đã được xử lý thông qua các tài khoản OpenAI dạng developer từ cuối năm 2024.
DeepSeek dường như đã tận dụng nguồn dữ liệu từ ChatGPT để đào tạo AI của họ (ảnh minh họa).
Bị cấm tại Italy vì lo ngại bảo mật dữ liệu
Theo thông tin từ trang Reuters (30/1/2025), ứng dụng của DeepSeek không còn truy cập được trên App Store và Google Play Store tại Italy. Garante (cơ quan bảo vệ dữ liệu Italy) đã yêu cầu DeepSeek cung cấp thông tin về việc sử dụng dữ liệu cá nhân của người dùng. Nhà chức trách muốn biết DeepSeek thu thập dữ liệu gì, từ nguồn nào, cho mục đích gì, trên cơ sở pháp lý nào và lưu trữ ở đâu.
DeepSeek hiện bị cấm tại Italy (ảnh minh họa). Nguồn: Tài khoản X (Twitter) AlternativeTo.
Bên cạnh đó, Chính phủ Mỹ cho biết các nhà chức trách đang xem xét những tác động đến an ninh quốc gia của DeepSeek. Ủy ban bảo vệ dữ liệu Ireland cũng đã gửi yêu cầu đến DeepSeek để tìm hiểu cách xử lý dữ liệu liên quan đến người dùng tại quốc gia này.
Đưa ra nhiều thông tin sai lệch hơn so với các chatbot AI khác
Trước đó vào ngày 29/1/2025, trang tin Reuters đã dẫn lại báo cáo từ NewsGuard (tổ chức xếp hạng mức độ tin cậy của thông tin) cho thấy ứng dụng chatbot AI DeepSeek đến từ Trung Quốc chỉ đạt 17% độ chính xác khi trả lời các câu hỏi liên quan đến tin tức thời sự. NewsGuard đã xếp DeepSeek ở thứ hạng 10/11 trong các chatbot AI được đánh giá.
Bảng kết quả cho thấy fail rate (tạm dịch: tỉ lệ sai lệch) của các chatbot AI khi đưa ra những thông tin thời sự. Nguồn: NewsGuard.
Một vài nhận định
Mình không quá bất ngờ khi DeepSeek để lộ thông tin cuộc trò chuyện người dùng bởi đây là một chatbot AI vẫn còn mới và OpenAI trước đó cũng gặp tình trạng tương tự với ChatGPT. Cụ thể theo trang The Hacker News (25/3/2023), một lỗi trong thư viện mã nguồn mở của OpenAI cho phép vài người dùng xem được mô tả ngắn gọn về cuộc trò chuyện của những người khác từ thanh lịch sử trò chuyện của ChatGPT. Vụ việc đã buộc OpenAI phải tạm thời đóng chatbot này.
Nếu OpenAI từng có vấn đề liên quan đến rò rỉ dữ liệu nhạy cảm thì DeepSeek hoàn toàn có thể gặp tình trạng tương tự (ảnh minh họa). Nguồn: Business Standard.
Có lẽ chúng ta nên cẩn trọng trước những dịch vụ AI mới nổi để tránh bị lộ thông tin cá nhân ngoài ý muốn. Bên cạnh đó, chúng ta chỉ nên xem AI là công cụ, không được phụ thuộc hoàn toàn vì các thông tin AI tạo ra sẽ có sai lệch và cần được kiểm chứng lại nhiều lần.
Vậy các bạn nhận xét như thế nào về DeepSeek? Bạn đang sử dụng chatbot AI nào không? Hãy thực hiện bảng vote bên dưới và để lại bình luận ở cuối bài viết để nêu lên cảm nghĩ của bạn, cảm ơn các bạn đã quan tâm và theo dõi.
Tham khảo: Reuters, Wiz, Bloomberg, Tinhte.vn, The Hacker News, NewsGuard.