Подразделение Google DeepMind объявило о запуске Gemini 2.5 Deep Think — самую продвинутую модель искусственного интеллекта компании, по словам самих разработчиков. Она способна отвечать на пользовательские запросы, исследуя и рассматривая несколько вариантов одновременно, а затем сравнивая полученные результаты и выбирая лучший из них. Обладатели подписки Google Ultra стоимостью $250 в месяц получат доступ к ИИ-модели уже на этой неделе.
Google анонсировала Gemini 2.5 Deep Think на ежегодной конференции Google I/O в мае этого года, заявив, что это первая общедоступная модель компании, содержащая в себе множество ИИ-агентов. Такой подход позволяет нейросети задействовать разных ИИ-агентов для параллельной обработки запроса и поиска разных вариантов ответа на него. Это также требует значительно больше вычислительных ресурсов, но и конечный результат, как правило, значительно лучше, чем при использовании системы с одним ИИ-агентом.
В прошлом месяце сообщалось, что алгоритм Gemini 2.5 Deep Think сумел добиться результатов на уровне золотой медали на Международной математической олимпиаде (IMO). Вместе с Gemini 2.5 Deep Think разработчики откроют доступ к версии ИИ-модели, которая участвовала в математической олимпиаде, но только для группы избранных математиков и учёных. Google рассчитывает, что этот алгоритм повысит эффективность исследований, поэтому компания стремится получить отзывы о том, как можно улучшить мультиагентную систему для использования в академических целях.
Google отметила, что ИИ-модель Gemini 2.5 Deep Think была значительно улучшена по сравнению с версией, которую анонсировали на конференции I/O в мае. Этому способствовала разработка «новых методов обучения с подкреплением», что стимулирует алгоритм к более эффективному использованию своих логических возможностей.
По данным Google, новая ИИ-модель хорошо справилась с тестом «Последний экзамен человечества», который содержит тысячи однозначных и проверяемых академических вопросов по математике, гуманитарным и естественным наукам. По данным Google, нейросеть компании набрала в этом тесте 34,8 % баллов, тогда как алгоритм Grok 4 от xAI набрал только 25,4 %, а OpenAI o3 — 20,3 %. Google также утверждает, что Gemini 2.5 Deep Think превосходит аналоги от OpenAI, xAI и Anthropic в бенчмарке LiveCodeBench6, где собраны сложные задачи по программированию. В серии тестов ИИ-модель Google набрала здесь 87,6 %, в то время как результат Grok 4 составил 79 %, а o3 — 72 %.
Gemini 2.5 Deep Think автоматически задействует нужные ИИ-агенты, например, для написания программного кода или поиска в интернете. По словам разработчиков, нейросеть способна выдавать «гораздо более длинные ответы» по сравнению с традиционными ИИ-моделями. В ближайшее время Google планирует открыть доступ к Gemini 2.5 Deep Think для избранной группы разработчиков через соответствующий API.