Google DeepMind 🆕 Новинка 20 февраля 2026

Gemini 3.1 Pro: Google перехватывает лидерство в гонке AI-моделей

19 февраля 2026 года Google DeepMind представила Gemini 3.1 Pro — обновлённую версию флагманской модели серии Gemini 3. По результатам ключевых бенчмарков, модель обходит как своего предшественника Gemini 3 Pro, так и конкурентов от Anthropic и OpenAI в большинстве категорий. Разбираемся, что в ней нового и стоит ли мигрировать.

🏆 Главные достижения в цифрах

Gemini 3.1 Pro — это не просто инкрементальное обновление. Прирост по ARC-AGI-2 (бенчмарк для оценки способности модели решать абсолютно новые логические задачи) составил более чем 2× относительно предыдущей версии. Это главная сенсация релиза.

77.1%

ARC-AGI-2

94.3%

GPQA Diamond

92.6%

MMLU

80.6%

SWE-Bench

📈 Прирост относительно Gemini 3 Pro

ARC-AGI-2

31.1%

77.1%

GPQA Diamond

91.9%

94.3%

SWE-Bench Ver.

76.2%

80.6%

Gemini 3 Pro

Gemini 3.1 Pro

ARC-AGI-2 — это тест не на заученные паттерны, а на способность модели решать задачи, которых она никогда не видела. Рост с 31% до 77% — это фундаментальный скачок в качестве рассуждений.

📊 Сравнительная таблица: Gemini 3.1 Pro vs конкуренты

Собрали актуальные данные по ключевым бенчмаркам на февраль 2026 года. В таблице приведены результаты четырёх моделей: новой Gemini 3.1 Pro, её предшественницы Gemini 3 Pro, Claude Opus 4.6 от Anthropic и GPT-5.2 от OpenAI.

Бенчмарк	Gemini 3.1 Pro	Gemini 3 Pro	Claude Opus 4.6	GPT-5.2
🧠 ARC-AGI-2 (логика)	77.1%	31.1%	68.8%	52.9%
🔬 GPQA Diamond (наука)	94.3%	91.9%	91.3%	92.4%
📝 MMLU (знания)	92.6%	—	91.1%	89.6%
🧩 Humanity's Last Exam	44.4%	—	40.0%	34.5%
💻 SWE-Bench Verified	80.6%	76.2%	80.8%	80.0%
💻 SWE-Bench Pro (Public)	54.2%	—	55.6%	56.8%*
📄 Контекстное окно	1M токенов	1M токенов	200K	128K
⚡ Скорость (tok/s)	106	—	—	—

* GPT-5.3 Codex с Codex harness. Данные по скорости — Artificial Analysis, февраль 2026.

Вывод: Gemini 3.1 Pro доминирует в задачах на рассуждения (ARC-AGI-2, GPQA, HLE) и общие знания (MMLU). В кодинге — картина более конкурентная: Claude Opus 4.6 незначительно впереди по SWE-Bench Verified, а GPT-5.3 Codex лидирует в SWE-Bench Pro. Но по совокупности показателей Gemini 3.1 Pro — наиболее универсальная модель на рынке.

🏅 ARC-AGI-2 — способность решать новые задачи

Gemini 3.1 Pro

77.1%

Claude Opus 4.6

68.8%

GPT-5.2

52.9%

Gemini 3 Pro

31.1%

💻 SWE-Bench Verified — реальные задачи по кодингу

Claude Opus 4.6

80.8%

Gemini 3.1 Pro

80.6%

GPT-5.2

80.0%

Gemini 3 Pro

76.2%

Gemini 3.1 Pro

Claude Opus 4.6

GPT-5.2

Gemini 3 Pro

🚀 Что нового в Gemini 3.1 Pro

🧠

Прорыв в рассуждениях

Более чем двукратный рост на ARC-AGI-2 (с 31% до 77%). Модель решает задачи, которых никогда не видела при обучении.

📚

1 000 000 токенов контекста

Полноценный анализ книг, кодовых баз и видео в одном запросе. Контекст в 4-8 раз больше, чем у конкурентов.

⚡

Medium Thinking Level

Новый режим «среднего уровня размышлений» — баланс между скоростью, стоимостью и качеством ответа.

🔧

Улучшенные агентные навыки

Стабильная работа в длинных цепочках задач, точная оркестрация инструментов и планирование действий.

🎞️

Мультимодальность

Нативная обработка текста, изображений, аудио, видео и кодовых репозиториев без дополнительных плагинов.

🏗️

Интеграция с Antigravity

Глубокая интеграция с новой IDE Google Antigravity — агент планирует, исполняет и проверяет код автономно.

💰 Стоимость: баланс между ценой и возможностями

Gemini 3.1 Pro позиционируется как модель для сложных задач, и цена это отражает. Однако по соотношению «качество бенчмарков / цена» она выгоднее прямого конкурента — Claude Opus 4.6, который стоит примерно вдвое дороже.

Gemini 3.1 Pro

Вход / 1M токенов

Выход / 1M токенов

$12

Preview-цена

Claude Opus 4.6

Вход / 1M токенов

$150

Выход / 1M токенов

$600

В 75× дороже на входе

GPT-5.2

Вход / 1M токенов

$30

Выход / 1M токенов

$60

В 15× дороже на входе

При preview-ценах $2/$12 за вход/выход, Gemini 3.1 Pro — одна из самых экономичных моделей среди топ-перформеров. Для задач, не требующих максимального контекста, можно сэкономить ещё больше.

🌍 Где попробовать Gemini 3.1 Pro

            Доступность на февраль 2026
            Разработчикам: Gemini API в Google AI Studio, Gemini CLI, Google Antigravity и
                    Android Studio
Предприятиям: Vertex AI и Gemini Enterprise
Пользователям: приложение Gemini и NotebookLM (AI Pro / Ultra для повышенных
                    лимитов)
В России: через приложение НейроЧат AI — без VPN и иностранных карт

        

⚔️ Gemini 3.1 Pro vs Gemini 3 Pro: стоит ли обновляться?

Gemini 3 Pro

предыдущее поколение

Gemini 3.1 Pro

февраль 2026

Однозначно да. Прирост по ARC-AGI-2 в 2.5 раза — это не эволюция, а качественный скачок. GPQA Diamond вырос с 91.9% до 94.3%, SWE-Bench — с 76.2% до 80.6%. Также добавлен новый средний уровень размышлений (medium thinking), улучшена стабильность при работе агентов на длинных горизонтах и оркестрации инструментов. Если вы используете Gemini 3 Pro — миграция на 3.1 Pro даст заметный прирост при тех же затратах.

🎯 Для каких задач выбрать Gemini 3.1 Pro?

            Идеально подходит для:
            Сложные рассуждения — математика, научный анализ, многошаговая логика
Работа с огромным контекстом — анализ кодовых баз, длинных документов и видео
Агентные задачи — автономное планирование, финансовое моделирование, автоматизация
                
Мультимодальный анализ — одновременная обработка текста, изображений, аудио
Кодинг — решение сложных багов, архитектурные решения, рефакторинг больших проектов
                

        

Когда лучше выбрать другую модель: Если основной сценарий — чистый кодинг без рассуждений, GPT-5.3 Codex может показать немного лучший результат на SWE-Bench Pro. Для бюджетных задач и простых запросов стоит рассмотреть Gemini Flash или аналогичные модели среднего класса.

❓ Частые вопросы

Gemini 3.1 Pro доступен бесплатно?

Модель доступна в предварительном доступе (preview) через Google AI Studio и Gemini API. Пользователи приложения Gemini с тарифами AI Pro и Ultra также получают доступ. В России модель можно попробовать через приложение НейроЧат AI.

Чем Gemini 3.1 Pro отличается от Gemini 3 Pro?

Главное отличие — прорыв в рассуждениях (ARC-AGI-2: 77.1% вместо 31.1%). Также улучшены кодинговые навыки (+4.4% на SWE-Bench), добавлен средний уровень размышлений, повышена стабильность в длинных агентных цепочках.

Gemini 3.1 Pro лучше Claude Opus 4.6?

В рассуждениях и общих знаниях — да: +8.3% на ARC-AGI-2, +3% на GPQA Diamond, +1.5% на MMLU. В кодинге (SWE-Bench Verified) — практически паритет (80.6% vs 80.8%). При этом Gemini 3.1 Pro в десятки раз дешевле Opus 4.6.

Что такое Medium Thinking Level?

Это новый режим, добавленный в Gemini 3.1 Pro. Он занимает промежуточную позицию между быстрым ответом и глубоким размышлением, позволяя оптимизировать баланс скорости, стоимости и качества ответа для конкретной задачи.

Как попробовать Gemini 3.1 Pro в России?

Через приложение НейроЧат AI — без VPN, без регистрации зарубежных аккаунтов и без оплаты иностранными картами. Скачайте бесплатно в RuStore.

Попробуйте лучшие AI-модели через НейроЧат AI

Gemini, Claude, DeepSeek — все топовые нейросети в одном приложении, на русском языке.

📲 Скачать в RuStore