Ngày 18/11 (giờ Mỹ), Google chính thức giới thiệu Gemini 3 trong bối cảnh các mô hình AI tạo sinh của hãng đang được đón nhận mạnh mẽ.
Theo hãng công nghệ Mỹ, tính năng AI Overviews trên Google Tìm kiếm đang có 2 tỷ người dùng mỗi tháng, còn ứng dụng Gemini đã vượt mốc 650 triệu người dùng hàng tháng.
Hơn 70% khách hàng Cloud đang sử dụng AI, 13 triệu nhà lập trình đã phát triển sản phẩm với các mô hình của Google.
Mỗi thế hệ Gemini đều được cải tiến liên tục. Gemini 1 mang đến đột phá về tính đa phương thức nguyên bản (native multimodality - khả năng xử lý nhiều loại dữ liệu như văn bản, hình ảnh, âm thanh cùng lúc một cách tự nhiên) và khả năng xử lý ngữ cảnh dài, mở rộng phạm vi thông tin có thể tiếp nhận.
Gemini 2 đặt nền móng cho các tính năng tác nhân (agentic capabilities - khả năng tự động thực hiện các nhiệm vụ phức tạp, nhiều bước, thay vì chỉ trả lời câu hỏi), thúc đẩy ranh giới mới về lập luận và tư duy, hỗ trợ xử lý các nhiệm vụ và ý tưởng phức tạp.
Giờ đây, Gemini 3 kết hợp toàn bộ năng lực này, tập trung vào khả năng lập luận tối tân. Mô hình được xây dựng để nắm bắt những tầng ý nghĩa sâu sắc và tinh tế, bao gồm cả việc nhận ra các gợi ý nhỏ hay bóc tách những lớp chồng chéo của một vấn đề phức tạp.
Nó cũng được cho là vượt trội hơn trong việc hiểu bối cảnh và mục đích đằng sau yêu cầu, giúp người dùng nhận được câu trả lời ưng ý với ít câu lệnh hơn.
Theo Demis Hassabis, CEO Google DeepMind và Koray Kavukcuoglu, CTO Google DeepMind kiêm Kiến trúc sư trưởng AI Google, Gemini 3 đánh dấu bước tiến hướng đến "trí tuệ nhân tạo tổng quát" (AGI).
Hai lãnh đạo gọi đây là mô hình lập trình tác nhân và vibe coding mạnh nhất từ trước đến nay của hãng.
Gemini 3 có gì đáng chú ý?
Gemini 3 được ra mắt với phiên bản trải nghiệm Gemini 3 Pro. Mô hình này được đánh giá là cấp tiến hơn Gemini 2.5 Pro trên mọi thước đo đánh giá AI quan trọng.
Về khả năng lập luận, Gemini 3 Pro đạt điểm số 1501 trên bảng xếp hạng LMArena, thể hiện năng lực lập luận ở trình độ tiến sĩ với điểm số hàng đầu trên các bài kiểm tra chuyên môn như Humanity’s Last Exam (37.5%) và GPQA Diamond (91.9%).
Gemini 3 được tích hợp vào nhiều sản phẩm của Google để hỗ trợ người dùng trong ba lĩnh vực chính: học tập, xây dựng và lập kế hoạch.
Với học tập, Gemini 3 mở rộng ranh giới của khả năng lập luận đa phương thức, giúp người dùng học theo cách phù hợp nhất. Mô hình có thể xử lý ngữ cảnh tối đa 1 triệu token đầu vào.
Nó có thể giải mã và dịch công thức viết tay sang nhiều ngôn ngữ, tạo sổ tay nấu ăn. Biến bài nghiên cứu học thuật, video bài giảng dài thành flashcard tương tác, hình ảnh trực quan. Phân tích video hoạt động thể thao, xác định điểm cần cải thiện và lên kế hoạch luyện tập.
Trong ứng dụng Google Tìm kiếm, Chế độ AI (AI Mode) nay sử dụng Gemini 3 để mang đến các trải nghiệm tạo sinh mới lạ trong giao diện người dùng (UI), như bố cục trực quan sống động, các công cụ và giả lập tương tác, được tạo ra tức thì dựa trên truy vấn của bạn.
Điều này giúp người dùng dễ dàng tìm hiểu các chủ đề phức tạp như cách thức hoạt động của RNA polymerase thông qua trải nghiệm trực quan.