Những điểm đáng chú ý của Gemini 3.5 Flash

Đăng lúc 23:12 20.05.2026

ại sự kiện Google I/O 2026 vừa qua, Google DeepMind đã chính thức công bố mô hình ngôn ngữ lớn mới nhất mang tên Gemini 3.5 Flash. Đây được định vị là phiên bản Flash thông minh nhất từ trước đến nay của hãng, hướng tới việc cân bằng giữa hiệu suất xử lý cao (mức frontier) với tốc độ phản hồi nhanh, độ trễ thấp và tối ưu hóa chi phí.



Ngay sau khi ra mắt, Gemini 3.5 Flash đã được áp dụng làm mô hình mặc định cho ứng dụng Gemini trên cả nền tảng web và thiết bị di động, đồng thời tích hợp vào chế độ AI Mode của công cụ Google Search trên toàn cầu. Một phiên bản sở hữu thông số lớn hơn là Gemini 3.5 Pro hiện đang trong quá trình thử nghiệm nội bộ và dự kiến sẽ được trình làng vào tháng 6/2026.

Gemini-I-O-2026-cover.webp

Sức mạnh kỹ thuật và khả năng xử lý đa phương thức


Điểm nhấn kỹ thuật đáng chú ý nhất của Gemini 3.5 Flash nằm ở cửa sổ ngữ cảnh (context window). Cụ thể, mô hình hỗ trợ tối đa 1.048.576 token cho dữ liệu đầu vào và 65.536 token cho dữ liệu đầu ra. Thông số này cho phép người dùng tải lên các tài liệu văn bản dài hàng trăm trang, các tệp mã nguồn (source code) dung lượng lớn, video thời lượng dài hoặc lịch sử trò chuyện phức tạp mà hệ thống vẫn duy trì được khả năng nhận diện ngữ cảnh xuyên suốt.

Spark---1.width-1000.format-webp.webp

Về khả năng xử lý đa phương thức (multimodal), hệ thống có thể phân tích đồng thời nhiều định dạng khác nhau bao gồm văn bản, hình ảnh, âm thanh, video, file PDF và mã nguồn. Ví dụ, người dùng có thể tải lên một video từ YouTube hoặc một tài liệu PDF dày 500 trang, sau đó yêu cầu AI tóm tắt chi tiết, trích xuất dữ liệu, hoặc thậm chí tạo ra các đoạn mã script mới dựa trên nội dung đã cung cấp.

Spark---4.width-1000.format-webp.webp

Để kiểm soát tài nguyên xử lý, Google cung cấp cho mô hình này 4 mức độ “Thinking effort” bao gồm tối thiểu, thấp, trung bình và cao. Mức trung bình được thiết lập làm mặc định, trong khi mức cao sẽ được hệ thống tự động kích hoạt đối với các tác vụ đòi hỏi sự suy luận phức tạp. Về mặt hiệu suất thô, Gemini 3.5 Flash có tốc độ xử lý đạt gần 300 token mỗi giây – nhanh gấp 4 lần so với nhiều mô hình cấp cao hiện nay. Chi phí sử dụng API cũng được tối ưu, ở mức khoảng 1,5 USD cho mỗi 1 triệu token đầu vào và 9 USD cho 1 triệu token đầu ra.

Chuyển dịch sang tự động hóa và AI Agent


Khác với định hướng của một chatbot truyền thống, Gemini 3.5 Flash được phát triển mạnh về khả năng Agentic (hoạt động độc lập như một tác nhân). Mô hình hỗ trợ gọi hàm (function calling), xuất dữ liệu theo cấu trúc, code execution và khả năng tìm kiếm thông tin thời gian thực thông qua Google Search, Google Maps hoặc tìm kiếm tệp tin.



Đặc tính này cho phép hệ thống triển khai các sub-agent (tác nhân phụ) chạy song song. Chẳng hạn, trong một quy trình nghiên cứu, người dùng có thể yêu cầu một agent chuyên thu thập dữ liệu, một agent khác phân tích và một agent thứ ba chịu trách nhiệm viết báo cáo gửi qua email. Khả năng xử lý các tác vụ dài hạn từ 10 đến 20 bước giúp mô hình có thể lập kế hoạch dự án, tự động tìm kiếm thông tin và tổ chức lại các bộ dữ liệu lộn xộn. Các doanh nghiệp như Shopify đã sử dụng mô hình này để dự báo tăng trưởng, hay Macquarie Bank dùng để xử lý hàng trăm trang tài liệu tài chính.



Hiệu năng trong lập trình và công việc thực tế


Khả năng lập trình và phát triển phần mềm được xem là thế mạnh lớn nhất của phiên bản lần này. Gemini 3.5 Flash có khả năng viết, gỡ lỗi (debug) và tối ưu hóa (refactor) hàng nghìn dòng lệnh chỉ thông qua một câu lệnh (prompt). Mô hình hỗ trợ lập trình lặp (iterative coding), cho phép người dùng yêu cầu xây dựng các giao diện phức tạp hoặc các nguyên mẫu ứng dụng, trò chơi hoàn chỉnh chỉ từ những mô tả bằng văn bản.



Trong các bài kiểm tra nội bộ về lập trình Agentic (tự động chạy code, thử nghiệm và tối ưu), mô hình đạt điểm số 76,2% trên bài test Terminal-Bench 2.1, vượt qua mức 70,3% của phiên bản Gemini 3.1 Pro trước đó. Bản demo của Google thậm chí đã trình diễn việc sử dụng hai sub-agent để xây dựng một tựa game có thể chơi được chỉ trong vòng 6 giờ dựa trên các tài liệu nghiên cứu. Tại môi trường phát triển Antigravity (IDE) của Google, tốc độ xử lý của mô hình nhanh gấp 12 lần ở một số tác vụ nhất định.

gemini-3-5--benchmarks--light-3.jpg

Bên cạnh lập trình, mô hình cũng cho thấy hiệu quả trong nghiên cứu chuyên sâu (Deep Research). Bằng việc kết hợp tính năng Grounding với Google Search, AI có thể lấy thông tin chính xác theo thời gian thực nhằm hạn chế tối đa hiện tượng hallucination. Hệ thống cũng xử lý tốt việc phân tích các dữ liệu khoa học, tài chính, y tế và trích xuất văn bản (OCR) từ các hóa đơn phức tạp, với hiệu suất cải thiện từ 19% đến 96% ở một số bài kiểm tra cấp doanh nghiệp so với thế hệ cũ.


Trong công việc hàng ngày, Gemini 3.5 Flash hỗ trợ giải quyết các bài toán phức tạp, lập kế hoạch du lịch kết hợp bản đồ, phân tích hồ sơ xin việc và dịch thuật đa ngôn ngữ với văn phong tự nhiên.

Spark---5.width-1000.format-webp.webp

Về mức độ phổ cập, phiên bản tiêu chuẩn của Gemini 3.5 Flash hiện được cung cấp miễn phí cho người dùng cá nhân thông qua nền tảng web và ứng dụng di động. Người dùng có nhu cầu xử lý dữ liệu lớn hơn có thể sử dụng gói Gemini Advanced. Đối với các nhà phát triển và doanh nghiệp, mô hình có thể được truy cập thông qua Google AI Studio, Gemini API, Vertex AI và hệ thống Gemini Enterprise Agent Platform dành cho việc tự động hóa các quy trình kinh doanh quy mô lớn. Tóm lại, Gemini 3.5 Flash đánh dấu sự chuyển đổi rõ rệt của Google từ việc phát triển các mô hình ngôn ngữ thụ động sang các hệ thống AI có khả năng tự động hóa và giải quyết vấn đề trực tiếp.

 
==***==

Khoá học: Quản trị Chiến lược Dành cho các Lãnh đạo Doanh nghiệp
Nhấn vào đây để bắt đầu khóa học

Khóa học: Trở thành chuyên gia Bảo mật và tấn công ANM- Hacker mũ trắng
Nhấn vào đây để bắt đầu khóa học

Chuyên gia phân tích, tự động hóa Web iMacros
Nhấn vào đây để bắt đầu khóa học

Xây dựng ứng dụng tự động hóa AutoIT
Nhấn vào đây để bắt đầu khóa học

Khóa đào tạo Hacker và Marketing Facebook từ A - Z
Nhấn vào đây để bắt đầu khóa học

Khóa học: Phân tích và trực quan hóa dữ liệu với Power BI
Nhấn vào đây để bắt đầu khóa học

Khóa học đào tạo Marketing Facebook thông minh
Nhấn vào đây để bắt đầu khóa học

Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Nhấn vào đây để bắt đầu khóa học

Làm chủ xây dựng Game chuyên nghiệp
Nhấn vào đây để bắt đầu khóa học

Trở thành chuyên gia Marketing Facebook thông minh
Nhấn vào đây để bắt đầu khóa học

Kỹ sảo Điện ảnh đỉnh cao với khóa học After Effect
Nhấn vào đây để bắt đầu khóa học

Trở thành chuyên gia Vẽ Đẳng Cấp với khóa học AI
Nhấn vào đây để bắt đầu khóa học

Làm Chủ thiết kế ảnh với Photoshop CC
Nhấn vào đây để bắt đầu khóa học

Dựng Phim Siêu đẳng với Adobe Premiere
Nhấn vào đây để bắt đầu khóa học

Khóa dựng phần mềm quản lý dành cho nhà Quản lý và Kế toán bằng MS ACCESS
Nhấn vào đây để bắt đầu khóa học

Khóa học Machine Learning cơ bản-Khoa học dữ liệu - AI
Nhấn vào đây để bắt đầu khóa học

Khóa học Đào tạo sử dụng Excel Chuyên nghiệp & ứng dụng
Nhấn vào đây để bắt đầu khóa học

Khóa học sử dụng PowerPoint Chuyên nghiệp & ứng dụng
Nhấn vào đây để bắt đầu khóa học

Khóa học xây dựng và quản trị hệ thống đào tạo trực tuyến
Nhấn vào đây để bắt đầu khóa học

Đóng góp nội dung

Gửi ý kiến cho ban biên tập
Gửi thông tin

Thông tin

ĐĂNG KÝ/LIÊN HỆ: