- Регистрация
- 17 Окт 2015
- Сообщения
- 11.615
- Репутация
- 4.228
- Реакции
- 15.370
OpenAI запускає інструмент, який миттєво створює відео з тексту
17.02.2024OpenAI представила інструмент, який може створювати відео з текстових підказок.
Нова модель, що отримала прізвисько Sora за японським словом «небо», може створювати реалістичний відеоматеріал тривалістю до хвилини, який дотримується вказівок користувача щодо тематики та стилю. Відповідно до публікації в блозі компанії, модель також може створювати відео на основі нерухомого зображення або доповнювати наявний матеріал новим матеріалом.
«Ми навчаємо штучний інтелект розуміти та симулювати фізичний світ у русі з метою навчання моделей, які допомагають людям розв'язувати проблеми, які вимагають взаємодії в реальному світі», — йдеться в дописі в блозі.
Одне відео, включене серед кількох початкових прикладів від компанії, було засноване на підказці: «Трейлер фільму про пригоди 30-річного космонавта в червоному вовняному в’язаному мотоциклетному шоломі, блакитне небо, солона пустеля, кінематографічний стиль, кадр на 35-мм плівці, яскраві кольори».
Компанія оголосила, що відкрила доступ до Sora для кількох дослідників і творців відео. Згідно з публікацією в блозі компанії, експерти об’єднали продукт у «червону команду» — перевірили його на сприйнятливість до умов обслуговування OpenAI, які забороняють «екстремальне насильство, сексуальний вміст, образи, що викликають ненависть, схожість зі знаменитостями або IP-адресу інших осіб». Компанія надає обмежений доступ лише дослідникам, художникам і режисерам, хоча генеральний директор Сем Альтман відповів на запити користувачів у Twitter після оголошення, додавши відеокліпи, які, за його словами, були зроблені Sora. Відео мають водяний знак, який показує, що вони створені ШІ.
У 2021 році компанія представила генератор нерухомих зображень Dall-E, а в листопаді 2022 року – генеративний чат-бот AI ChatGPT, який швидко набрав 100 мільйонів користувачів. Інші компанії зі штучним інтелектом дебютували з інструментами генерації відео, хоча ці моделі були здатні створювати лише кілька секунд відеоматеріалу, який часто мало пов’язаний з їхніми підказками. Google і Meta заявили, що вони знаходяться в процесі розробки генеративних відеоінструментів, хоча вони не випустили їх для громадськості. У середу він оголосив про експеримент із додаванням глибшої пам’яті в ChatGPT, щоб він міг запам’ятати більше чатів своїх користувачів.
OpenAI не розголошує, скільки матеріалів було використано для навчання Сори або звідки могли походити навчальні відео, окрім того, що New York Times повідомила, що корпус містив відео, які були як загальнодоступними, так і ліцензованими від власників авторських прав. На компанію неодноразово подавали позов за нібито порушення авторських прав під час навчання її генеративних інструментів штучного інтелекту, які перетравлюють величезну кількість матеріалів, зібраних з Інтернету, і імітують зображення або текст, що міститься в цих наборах даних.