OpenAI представила Sora 2 — новое поколение своей системы генерации видео. По словам компании, новая версия создаёт видеоролики, которые большинство людей не могут отличить от реальных съёмок.
Главные улучшения по сравнению с первой Sora — продолжительность видео (до 5 минут против 1 минуты), разрешение (4K) и точность соблюдения физических законов.
Именно последний пункт стал наиболее обсуждаемым. Sora 2 значительно лучше понимает, как движутся объекты в реальном мире: жидкости текут естественно, ткань развевается согласно законам аэродинамики, а освещение корректно меняется при перемещении объектов.
В демонстрационных роликах, опубликованных OpenAI, Sora 2 показывает впечатляющую точность в воспроизведении сложных сцен: многолюдные городские улицы, природные ландшафты, архитектурные интерьеры.
Инструмент также получил новые возможности для редактирования: теперь можно указать конкретный объект в уже готовом видео и изменить его (например, поменять цвет машины или заменить дерево на здание), не затрагивая остальное изображение.
Sora 2 доступна пользователям ChatGPT Pro и корпоративным клиентам. API для разработчиков пока открыт только для ограниченного круга партнёров.
Выход Sora 2 вызвал острые дискуссии об этике и рисках deepfake-видео. OpenAI ввела несколько уровней защиты: водяные знаки в метаданных, ограничения на изображение реальных публичных лиц и систему модерации контента.


