Tất cả những gì bạn cần biết về DeepSeek, so sánh nhanh với ChatGPT o1

Đăng lúc 23:03 29.01.2025

Khi chúng ta đang tưng bừng đón Tết âm lịch 3 ngày qua thì thế giới công nghệ cũng tưng bừng với sự xuất hiện của Deep Seek - mô hình ngôn ngữ "giá rẻ" của startup TQ, nổi lên như sự đe dọa vị trí độc quyền của các công ty Mỹ với hiệu suất tương đương cả GPT o1 của OpenAI, tiết kiệm tài nguyên và đặc biệt là được phát hành "miễn phí" thay vì 20 đô như những dịch vụ khác.



Bài viết này xin được tổng hợp lại toàn bộ những thông tin xoay quanh Deep Seek. Mình sẽ đứng ở góc độ của một người dùng bình thường, hay dùng các dịch vụ chatbot AI để phục vụ các tác vụ công việc để xem Deep Seek là gì, làm được gì, tại sao người ta quan tâm nó khủng khiếp,...

Khoảnh khắc Deep Seek


Mấy ngày qua, mình thường xuyên lướt thấy cụm từ "Deep Seek Moment" khi người ta nhắc tới mô hình ngôn ngữ này. Có thể lý giải cụm từ này bằng sự đột phá của nó giữa thị trường các ứng dụng LLM vốn độc tôn bởi các công ty lớn từ phương Tây trước giờ. Trước giờ, chúng ta biết tới các LLM đình đám như ChatGPT của Open AI, Gemini của Google, Claude của Anthropic, mã nguồn mở Llama của Meta,... Mỗi nhà cung cấp đều có một cách tiếp cận riêng, một điểm mạnh riêng khi xây dựng LLM và đều cung cấp gói dịch vụ cỡ 20 đô để cung cấp bản "pro" xài bớt giới hạn các tính năng, số token của LLM.

Vẫn có nhiều nhóm nghiên cứu LLM khác từ khắp nơi trên thế giới, bao gồm cả TQ cũng tham gia phát triển model LLM. Tuy nhiên hầu hết đều dừng lại một model hẹp hoặc finetune cho một lĩnh vực nào đó và chưa thực sự có bước tiến về mặt kiến trúc xây dựng model. Nhiều startup TQ cũng lác đác công bố các model nhưng phần lớn đều dừng lại ở nghiên cứu hoặc tuyên bố, chưa có sản phẩm cụ thể.

Và rồi sát tết Ất Tỵ 2025, Deep Seek được chính thức phát hành miễn phí cho mọi người dùng, cả bằng web lẫn app điện thoại. Và dù miễn phí, nó có hiệu suất thậm chí cao hơn cả model được cho là xịn nhất là GPT o1 của OpenAI, cái vốn cần được trả 20 đô mỗi tháng mới tiếp cận được. Nói cách khác, không cần trả 20 đô mỗi tháng, người dùng đã có thể có được 1 chatbot mạnh tương đương và làm được nhiều chuyện như một trong những con LLM xịn nhất bây giờ. Chỉ bằng 2 yếu tố mạnh và miễn phí, Deep Seek đã tạo nên làn sóng khủng khiếp trong giới công nghệ.

Deep Seek “miễn phí”


Hiện tại, người dùng chỉ cần vào trang chủ Deep Seek hoặc tải app về trên iOS hoặc Android, đăng ký là có thể xài miễn phí những thứ xịn nhất của Deep Seek - không giới hạn, không có gói đăng ký gì hết.

[​IMG]

Nếu sử dụng Deep Seek bằng cách này, toàn bộ thông tin và bạn nhập vào truy vấn sẽ được gởi về lưu ở Trung Quốc và có thể được nhà phát triển xài để huấn luyện model hoặc làm gì đó theo ý họ. Thông tin này được Deep Seek công bố rõ ràng ngay trên thỏa thuận sử dụng đăng trên trang chủ của họ. Cụ thể, họ sẽ lưu trữ thông tin cá nhân, input, tương tác với chatbot và thông tin thanh toán của người dùng cho tới khi nào cần thiết, có thể dùng để hoàn thiện và cải thiện dịch vụ hoặc cần sử dụng liên quan tới quy định pháp lý. Tài liệu nói rõ "Chúng tôi lưu thông tin mà chúng tôi thu thập được tại máy chủ đặt ở Trung Quốc.

Rõ ràng, để sử dụng model LLM xịn như ChatGPT o1 mà không tốn đồng nào thì đó là cái người dùng phải chấp nhận.

Nhưng cần phải làm rõ ở đây, đó là khi bạn dùng Deep Seek qua giao diện trang chủ của họ hoặc qua ứng dụng.

Bởi Deep Seek LLM vẫn được phát hành mã nguồn mở nên chúng ta vẫn còn một cách sử dụng khác là kéo nó về chạy local ngay trên máy tính bằng các công cụ CLI, Ollama hoặc LMStudio. Lúc này chúng ta có thể sử dụng nó không cần mạng, nghĩa là an toàn thông tin đối với những ai lo ngại về chuyện bảo mật. Và đánh đổi lại, cách này chỉ có thể sử dụng được các model rút gọn, có thể sẽ giới hạn khả năng suy luận và độ chính xác của phản hồi từ chatbot so với "bản full" khi xài trên trang chủ Deep Seek.

Cái này mình sẽ làm 1 bài hướng dẫn cách đơn giản nhất để kéo model về chạy locally cho bạn nào quan tâm ở một bài khác nha.



Deep Seek và các bigtech AI khác


Tính tới hiện tại, điểm ăn tiền lớn nhất của Deep Seek vẫn là cung cấp cái rất xịn của đối thủ cho người dùng một cách hào phóng (tất nhiên cái gì cũng có cái giá của nó). Đây chính là cái đã khiến cho Deep Seek hype khủng khiếp những ngày vừa qua. Nền web thì liên tục xuất hiện quá tải còn ứng dụng trên điện thoại thì nhanh chóng đạt tốp ứng dụng miễn phí ở nhiều khu vực trên thế giới.

Và đó chính là một trong những vấn đề mà các công ty công nghệ khác quan tâm. Ở đây mình không bàn sâu tới câu chuyện Deep Seek tuyên bố tạo ra LLM chỉ chưa tới 5 triệu đô, mình cũng không đi sâu vào thuật toán thông minh của Deep Seek vốn là cái được nhiều người cho là đe dọa các công ty Mỹ.

Chỉ đơn cử ở chuyện miễn phí cho xài đồ xịn đã là cách thu hút khách hàng đổ xô vào vào Deep Seek những ngày qua rồi. Đồng thời, cách mà Deep Seek mở mã nguồn và cho người dùng tải về xài local (tất nhiên là tốn nhiều bước hơn, phức tạp hơn, lại đòi hỏi phần cứng vận hành nên không phải ai cũng dễ làm được) cũng là điểm mà rất ít bigtech nào làm trước giờ.

Đối với những bạn nào đang dùng LLM ở góc độ phát triển ứng dụng thì tiếp tục thấy được một điểm hấp dẫn khác ở Deep Seek so với OpenAI chính là giá xài API. Hiện OpenAI đang có giá là 7,5 đô la cho 1 triệu token cache input đối với o1, trong khi con số này bên Deep Seek chỉ có 0,16 đô la. Tương tự, giá 1 triệu token output của Deep Seek chỉ có 2,19 đô trong khi OpenAI o1 là 60 đô. Rõ ràng cách biệt quá lớn. Đúng chất rẻ như TQ ????

So sánh nhanh chatbot Deep Seek và GPT o1


So sánh nhanh về giao diện và tính năng, hiện tại DeepSeek chỉ tập trung vào chatbot và phân tích tài liệu nên chỉ có 2 tính năng chính đó được cung cấp. Người dùng có thể tải các tập tin lên để LLM phân tích cùng với prompt và người dùng nhập vào. Đồng thời người dùng có thể bật tắt tính năng tìm kiếm trên web và kích hoạt hoặc tắt chế độ suy luận sâu của model.



Đối với ChatGPT thì có nhiều tính năng hơn rất nhiều được cung cấp. Nó bao gồm tất cả các tính năng của Deep Seek và thêm các tính năng khác như các model được finetune sẵn với đa dạng các nhu cầu. Đặc biệt là tính năng canvas cực kỳ hữu dụng cho phép người dùng tương tác trực tiếp và song song khi làm việc với chatbot ở từng thành phần của văn bản.

Về tốc độ phản hồi. Mình thử chạy cùng một prompt ở 2 model là Deep Seek R1 và ChatGPT o1 để tiện so sánh. Hầu hết là các tác vụ khá nặng với prompt nhiều thành phần, được craft kỹ và đòi hỏi suy luận thì có sự chênh lệch rõ về tốc độ phản hồi của 2 bên. Hầu hết các lần chạy, ChatGPT o1 trả kết quả nhanh hơn so với Deep Seek R1.

Screenshot 2025-01-29 at 16.34.57.png
Cụ thể mình thử craft một prompt bắt model tạo ra bài viết với rất nhiều yêu cầu về động cơ vĩnh cửu. ChatGPT mất 17 giây để suy luận và trả về kết quả như hình trên.

Screenshot 2025-01-29 at 16.42.56.png
Trong khi đó Deep Seek R1 mất 26 giây để suy nghĩ. (tại thời điểm mình thử, trưa ngày 29/1/2025, DeepSeek liên tục bị quá tải máy chủ dẫn tới không thể xử lý prompt mình nhập vào. Phải bấm thử nhiều lần mới được, khá bực mình)

Screenshot 2025-01-29 at 16.59.50.png
Tiếp theo, mình thử kêu ChatGPT o1 tạo một game Tetris. Mất 6 giây để model suy luận và sinh ra nội dung code game bên dưới. Đối với ChatGPT, chúng ta có thể bấm vào nút edit bên cạnh khung chưa code để hiện ra giao diện cavas edit code và sau đó chạy thử với console luôn.

Screenshot 2025-01-29 at 18.26.49.png
Với tình huống này, Deep Seek tiếp tục mất nhiều thời gian hơn để suy luận và trả về kết quả. Riêng có thao tác chạy thử code thì bên này đơn giản hơn, người dùng chỉ cần bấm vào nút run ở cạnh dưới khung code do AI sinh ra là popup chạy lên. Tính năng chạy code này đơn giản như Claude nên mình khá thích, không cần bấm nhiều như ChatGPT. Tuy nhiên hiện có vẻ Deep Seek chỉ mới chạy được HTML chứ Python thì chưa chạy được.

Screenshot 2025-01-29 at 18.18.58.png
Trong thí dụ này, mình thử kêu ChatGPT o1 tạo một trang web đổi đơn vị, cung cấp thêm thông tin về lịch sử mỗi đơn vị và bắt nó tạo theo theme màu với mã hex cho sẵn. Kết quả nó mất 35 giây để tạo ra một trang web bằng HTML, CSS và JS.

Screenshot 2025-01-29 at 17.13.17.png
Deep Seek mất 20 giây để tạo ra giao diện HTML và có thể chạy như thế này.

Các cập nhật sắp tới


Có bạn hỏi mình là vậy có thể dùng Deep Seek để train hay custom nó lại theo ý muốn với tập data có sẵn không (có bạn còn hỏi để kiếm tiền nữa). Câu trả lời là hiện không thể nha. Deep Seek không hề công bố cấu trúc Dataset và cả các thuật toán mà họ dùng để đánh giá các câu trả lời, logic trả về kết quả nên việc đó là không thể. Hiện tại tất cả những gì chúng ta có thể làm là dùng Deep Seek theo 2 cách nói trên.

Chắc chắn đây vẫn mới là bước đầu tiên của cuộc chơi. Sẽ còn khá nhiều thứ hay mà cả Deep Seek sẽ làm với dịch vụ của họ và cả động thái sắp tới của cả các bên nữa. Chúng ta hãy cùng hóng nha.

 
==***==

Khoá học: Quản trị Chiến lược Dành cho các Lãnh đạo Doanh nghiệp
Nhấn vào đây để bắt đầu khóa học

Khóa học: Trở thành chuyên gia Bảo mật và tấn công ANM- Hacker mũ trắng
Nhấn vào đây để bắt đầu khóa học

Chuyên gia phân tích, tự động hóa Web iMacros
Nhấn vào đây để bắt đầu khóa học

Xây dựng ứng dụng tự động hóa AutoIT
Nhấn vào đây để bắt đầu khóa học

Khóa đào tạo Hacker và Marketing Facebook từ A - Z
Nhấn vào đây để bắt đầu khóa học

Khóa học: Phân tích và trực quan hóa dữ liệu với Power BI
Nhấn vào đây để bắt đầu khóa học

Khóa học đào tạo Marketing Facebook thông minh
Nhấn vào đây để bắt đầu khóa học

Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Nhấn vào đây để bắt đầu khóa học

Làm chủ xây dựng Game chuyên nghiệp
Nhấn vào đây để bắt đầu khóa học

Trở thành chuyên gia Marketing Facebook thông minh
Nhấn vào đây để bắt đầu khóa học

Kỹ sảo Điện ảnh đỉnh cao với khóa học After Effect
Nhấn vào đây để bắt đầu khóa học

Trở thành chuyên gia Vẽ Đẳng Cấp với khóa học AI
Nhấn vào đây để bắt đầu khóa học

Làm Chủ thiết kế ảnh với Photoshop CC
Nhấn vào đây để bắt đầu khóa học

Dựng Phim Siêu đẳng với Adobe Premiere
Nhấn vào đây để bắt đầu khóa học

Khóa dựng phần mềm quản lý dành cho nhà Quản lý và Kế toán bằng MS ACCESS
Nhấn vào đây để bắt đầu khóa học

Khóa học Machine Learning cơ bản-Khoa học dữ liệu - AI
Nhấn vào đây để bắt đầu khóa học

Khóa học Đào tạo sử dụng Excel Chuyên nghiệp & ứng dụng
Nhấn vào đây để bắt đầu khóa học

Khóa học sử dụng PowerPoint Chuyên nghiệp & ứng dụng
Nhấn vào đây để bắt đầu khóa học

Khóa học xây dựng và quản trị hệ thống đào tạo trực tuyến
Nhấn vào đây để bắt đầu khóa học

Đóng góp nội dung

Gửi ý kiến cho ban biên tập
Gửi thông tin

Thông tin

ĐĂNG KÝ/LIÊN HỆ: