Anthropic обновила Claude 3.5 Sonnet: модель заняла первое место на SWE-bench — главном бенчмарке для оценки программирования. Она решила 49% реальных задач из GitHub.
Ключевое нововведение — режим Computer Use: Claude теперь сам управляет браузером, кликает, заполняет формы и запускает терминал без участия человека.
Разработчики называют это прорывом: ИИ-агент может выполнять многоэтапные рабочие задачи полностью автономно.
Ai Treasure Lab - Подписаться 😀


