Rò rỉ bản cập nhật lớn của Gemini cho Mac: Tích hợp AI đọc màn hình và can thiệp file hệ thống
Đăng lúc
23:01 19.05.2026
Ngay trước thềm sự kiện Google I/O, các nguồn tin rò rỉ cho thấy ứng dụng Gemini dành cho máy Mac sắp đón nhận một bản cập nhật toàn diện. Thay vì chỉ là một giao diện bọc ngoài khung chat như hiện tại, Google đang muốn biến ứng dụng này thành một hệ thống AI thực thụ (agentic stack), nhằm cạnh tranh trực tiếp với ChatGPT trên macOS của OpenAI và Claude của Anthropic.

Bản cập nhật dự kiến mang đến bốn tính năng cốt lõi. Đầu tiên là chế độ Gemini Live hoạt động dưới dạng cửa sổ nổi. Tính năng này cho phép AI trực tiếp quan sát các nội dung đang hiển thị trên màn hình và phản hồi với người dùng theo thời gian thực bằng giọng nói. Kết hợp với đó là công cụ "Stream to Cursor" được phát triển từ dự án Magic Pointer. Công cụ này giúp con trỏ chuột tự động phân tích ngữ cảnh của bất kỳ thành phần nào nó lướt qua trên màn hình và đưa ra gợi ý mà không cần người dùng phải chủ động nhập lệnh.
Video is being processed. Comeback later.
Bên cạnh đó, khả năng tạo video trực tiếp ngay trên phần mềm desktop cũng sẽ được tích hợp thông qua hệ thống có tên mã "Veo4 Omni".
Sự thay đổi quan trọng nhất nằm ở Gemini Spark. Đây là một trợ lý hệ thống (agent) có khả năng truy cập vào các thư mục cục bộ trên máy Mac để tự động phân tích, chỉnh sửa, di chuyển và đổi tên tệp tin. Spark cũng liên kết chặt chẽ với Google Drive và các dịch vụ Google khác, đặt nó vào thế đối đầu trực tiếp với các dự án kiểm soát hệ thống như OpenAI Codex hay Claude Code.