Google DeepMind представила обновлённую версию Gemini 2 Pro, своей самой мощной языковой модели. Обновление сосредоточено на двух ключевых областях: программировании и научных вычислениях.
В задачах кодирования новый Gemini 2 Pro демонстрирует значительный прогресс. На бенчмарке SWE-bench, который проверяет способность модели решать реальные баги из открытых репозиториев, модель теперь успешно закрывает 71% задач — рост на 18 процентных пунктов по сравнению с предыдущей версией.
Google также существенно улучшила поддержку научных задач. Gemini 2 Pro теперь способна работать с LaTeX-формулами, анализировать научные статьи в формате PDF и выполнять символические математические вычисления.
Особое внимание в обновлении уделено работе с кодом в реальных проектах. Модель лучше понимает зависимости между файлами, архитектурные паттерны и принимает во внимание контекст всего проекта при генерации или правке кода.
Для разработчиков важна поддержка нового режима «Code Streaming» — когда модель генерирует код, он немедленно проверяется синтаксически, и при обнаружении ошибки модель исправляет её «на лету», не дожидаясь окончания генерации.
Gemini 2 Pro доступен через Google AI Studio, Vertex AI и интегрирован в Google Workspace. Для API-разработчиков стоимость не изменилась — $3.5 за миллион входных токенов.
Google также объявила о планах выпустить специализированную версию Gemini Science для академических и исследовательских организаций с расширенными возможностями работы с научными данными.


