🔬 Обзор · 20 февраля 2026
Gemini 3.1 Pro
Новый флагман Google DeepMind. 1M токенов. Первое место в бенчмарках.
77.1% ARC-AGI-2 · 94.3% GPQA · 80.6% SWE-Bench
← Все новости
Google DeepMind 🆕 Новинка 20 февраля 2026

Gemini 3.1 Pro: Google перехватывает лидерство в гонке AI-моделей

19 февраля 2026 года Google DeepMind представила Gemini 3.1 Pro — обновлённую версию флагманской модели серии Gemini 3. По результатам ключевых бенчмарков, модель обходит как своего предшественника Gemini 3 Pro, так и конкурентов от Anthropic и OpenAI в большинстве категорий. Разбираемся, что в ней нового и стоит ли мигрировать.

🏆 Главные достижения в цифрах

Gemini 3.1 Pro — это не просто инкрементальное обновление. Прирост по ARC-AGI-2 (бенчмарк для оценки способности модели решать абсолютно новые логические задачи) составил более чем 2× относительно предыдущей версии. Это главная сенсация релиза.

77.1%
ARC-AGI-2
94.3%
GPQA Diamond
92.6%
MMLU
80.6%
SWE-Bench
📈 Прирост относительно Gemini 3 Pro
ARC-AGI-2
31.1%
77.1%
GPQA Diamond
91.9%
94.3%
SWE-Bench Ver.
76.2%
80.6%
Gemini 3 Pro
Gemini 3.1 Pro
ARC-AGI-2 — это тест не на заученные паттерны, а на способность модели решать задачи, которых она никогда не видела. Рост с 31% до 77% — это фундаментальный скачок в качестве рассуждений.

📊 Сравнительная таблица: Gemini 3.1 Pro vs конкуренты

Собрали актуальные данные по ключевым бенчмаркам на февраль 2026 года. В таблице приведены результаты четырёх моделей: новой Gemini 3.1 Pro, её предшественницы Gemini 3 Pro, Claude Opus 4.6 от Anthropic и GPT-5.2 от OpenAI.

Бенчмарк Gemini 3.1 Pro Gemini 3 Pro Claude Opus 4.6 GPT-5.2
🧠 ARC-AGI-2 (логика) 77.1% 31.1% 68.8% 52.9%
🔬 GPQA Diamond (наука) 94.3% 91.9% 91.3% 92.4%
📝 MMLU (знания) 92.6% 91.1% 89.6%
🧩 Humanity's Last Exam 44.4% 40.0% 34.5%
💻 SWE-Bench Verified 80.6% 76.2% 80.8% 80.0%
💻 SWE-Bench Pro (Public) 54.2% 55.6% 56.8%*
📄 Контекстное окно 1M токенов 1M токенов 200K 128K
⚡ Скорость (tok/s) 106

* GPT-5.3 Codex с Codex harness. Данные по скорости — Artificial Analysis, февраль 2026.

Вывод: Gemini 3.1 Pro доминирует в задачах на рассуждения (ARC-AGI-2, GPQA, HLE) и общие знания (MMLU). В кодинге — картина более конкурентная: Claude Opus 4.6 незначительно впереди по SWE-Bench Verified, а GPT-5.3 Codex лидирует в SWE-Bench Pro. Но по совокупности показателей Gemini 3.1 Pro — наиболее универсальная модель на рынке.

🏅 ARC-AGI-2 — способность решать новые задачи
Gemini 3.1 Pro
77.1%
Claude Opus 4.6
68.8%
GPT-5.2
52.9%
Gemini 3 Pro
31.1%
💻 SWE-Bench Verified — реальные задачи по кодингу
Claude Opus 4.6
80.8%
Gemini 3.1 Pro
80.6%
GPT-5.2
80.0%
Gemini 3 Pro
76.2%
Gemini 3.1 Pro
Claude Opus 4.6
GPT-5.2
Gemini 3 Pro

🚀 Что нового в Gemini 3.1 Pro

🧠

Прорыв в рассуждениях

Более чем двукратный рост на ARC-AGI-2 (с 31% до 77%). Модель решает задачи, которых никогда не видела при обучении.

📚

1 000 000 токенов контекста

Полноценный анализ книг, кодовых баз и видео в одном запросе. Контекст в 4-8 раз больше, чем у конкурентов.

Medium Thinking Level

Новый режим «среднего уровня размышлений» — баланс между скоростью, стоимостью и качеством ответа.

🔧

Улучшенные агентные навыки

Стабильная работа в длинных цепочках задач, точная оркестрация инструментов и планирование действий.

🎞️

Мультимодальность

Нативная обработка текста, изображений, аудио, видео и кодовых репозиториев без дополнительных плагинов.

🏗️

Интеграция с Antigravity

Глубокая интеграция с новой IDE Google Antigravity — агент планирует, исполняет и проверяет код автономно.

💰 Стоимость: баланс между ценой и возможностями

Gemini 3.1 Pro позиционируется как модель для сложных задач, и цена это отражает. Однако по соотношению «качество бенчмарков / цена» она выгоднее прямого конкурента — Claude Opus 4.6, который стоит примерно вдвое дороже.

Gemini 3.1 Pro
Вход / 1M токенов
$2
Выход / 1M токенов
$12
Preview-цена
Claude Opus 4.6
Вход / 1M токенов
$150
Выход / 1M токенов
$600
В 75× дороже на входе
GPT-5.2
Вход / 1M токенов
$30
Выход / 1M токенов
$60
В 15× дороже на входе
При preview-ценах $2/$12 за вход/выход, Gemini 3.1 Pro — одна из самых экономичных моделей среди топ-перформеров. Для задач, не требующих максимального контекста, можно сэкономить ещё больше.

🌍 Где попробовать Gemini 3.1 Pro

Доступность на февраль 2026

⚔️ Gemini 3.1 Pro vs Gemini 3 Pro: стоит ли обновляться?

Gemini 3 Pro
предыдущее поколение
VS
Gemini 3.1 Pro
февраль 2026

Однозначно да. Прирост по ARC-AGI-2 в 2.5 раза — это не эволюция, а качественный скачок. GPQA Diamond вырос с 91.9% до 94.3%, SWE-Bench — с 76.2% до 80.6%. Также добавлен новый средний уровень размышлений (medium thinking), улучшена стабильность при работе агентов на длинных горизонтах и оркестрации инструментов. Если вы используете Gemini 3 Pro — миграция на 3.1 Pro даст заметный прирост при тех же затратах.

🎯 Для каких задач выбрать Gemini 3.1 Pro?

Идеально подходит для:

Когда лучше выбрать другую модель: Если основной сценарий — чистый кодинг без рассуждений, GPT-5.3 Codex может показать немного лучший результат на SWE-Bench Pro. Для бюджетных задач и простых запросов стоит рассмотреть Gemini Flash или аналогичные модели среднего класса.

❓ Частые вопросы

Gemini 3.1 Pro доступен бесплатно?
Модель доступна в предварительном доступе (preview) через Google AI Studio и Gemini API. Пользователи приложения Gemini с тарифами AI Pro и Ultra также получают доступ. В России модель можно попробовать через приложение НейроЧат AI.
Чем Gemini 3.1 Pro отличается от Gemini 3 Pro?
Главное отличие — прорыв в рассуждениях (ARC-AGI-2: 77.1% вместо 31.1%). Также улучшены кодинговые навыки (+4.4% на SWE-Bench), добавлен средний уровень размышлений, повышена стабильность в длинных агентных цепочках.
Gemini 3.1 Pro лучше Claude Opus 4.6?
В рассуждениях и общих знаниях — да: +8.3% на ARC-AGI-2, +3% на GPQA Diamond, +1.5% на MMLU. В кодинге (SWE-Bench Verified) — практически паритет (80.6% vs 80.8%). При этом Gemini 3.1 Pro в десятки раз дешевле Opus 4.6.
Что такое Medium Thinking Level?
Это новый режим, добавленный в Gemini 3.1 Pro. Он занимает промежуточную позицию между быстрым ответом и глубоким размышлением, позволяя оптимизировать баланс скорости, стоимости и качества ответа для конкретной задачи.
Как попробовать Gemini 3.1 Pro в России?
Через приложение НейроЧат AI — без VPN, без регистрации зарубежных аккаунтов и без оплаты иностранными картами. Скачайте бесплатно в RuStore.

Попробуйте лучшие AI-модели через НейроЧат AI

Gemini, Claude, DeepSeek — все топовые нейросети в одном приложении, на русском языке.

📲 Скачать в RuStore