Google представила новую систему искусственного интеллекта, которая может существенно изменить подход к созданию и редактированию видео. Компания обещает, что сложный монтаж станет доступным даже для пользователей без опыта — достаточно будет просто описать нужный результат в диалоге с нейросетью, пишет Techradar.
На конференции Google I/O 2026 была показана мультимодальная модель Gemini Omni, объединяющая генерацию контента, работу с медиа и логическое понимание запросов в единой системе. Первой версией стала Gemini Omni Flash, ориентированная прежде всего на создание и обработку видео.
По задумке Google, новая технология должна снизить порог входа в видеопроизводство. Пользователь сможет работать не с таймлайнами и сложными инструментами монтажа, а с обычными текстовыми запросами. Система принимает разные типы данных — текст, изображения, аудио и видео — и на их основе формирует или редактирует ролики.
Ключевая идея проекта — так называемое «разговорное редактирование». Вместо ручной работы с эффектами пользователь может просто попросить изменить сцену: заменить фон, скорректировать освещение или движение объектов. Модель при этом должна сохранять целостность изображения и естественность происходящего.
Google также делает акцент на физической реалистичности. Система лучше моделирует поведение объектов, включая гравитацию и инерцию, что позволяет создавать более правдоподобные визуальные эффекты и сложные сцены.
Gemini Omni Flash уже начинают внедрять в экосистему Google — в приложение Gemini, сервисы YouTube Shorts и YouTube Create, а также платформу Google Flow. В дальнейшем доступ к технологии планируется открыть и для разработчиков через API.
Развитие проекта происходит на фоне усиливающейся конкуренции в сфере генеративного видео. Компании стремятся не только улучшить качество контента, но и максимально упростить его создание. Google делает ставку именно на интуитивное взаимодействие, когда работа с видео превращается в диалог с системой.
Отдельное внимание уделено вопросам прозрачности. Весь контент, созданный с помощью Gemini Omni, будет автоматически маркироваться цифровым водяным знаком SynthID, который позволит определить, что материал создан искусственным интеллектом. Такие механизмы планируется интегрировать в сервисы Google, включая Chrome и поисковую систему.
Также пользователям предложат создание персональных видеоаватаров с использованием собственного голоса. При этом более сложные функции, связанные с изменением личности или голоса в кадре, пока проходят дополнительную проверку безопасности.
Таким образом, Google продвигает идею, при которой создание видео становится максимально простым и доступным, но при этом сопровождается инструментами контроля и маркировки AI-контента.
Ранее мы рассказывали, что TikTok запускает новую функцию: можно будет бронировать путешествие и находить достопримечательности, показанные в видеороликах.
Пенсионерам в мае доплатят 1300 гривен
"Ощадбанк" отключает карты: осталось несколько недель
Штрафы за колодцы и скважины: готовят новые наказания за воду
В Украине установили тарифы на свет и газ с 1 июня
Кроме того, "Знай" передавал
