Интересно 15 секунд – и вы овладеете любым языком, даже не умея говорить...

Sepultura_North

Support Gourmet inc
Seller
Ровный
Мес†ный
Регистрация
17 Окт 2015
Сообщения
11.603
Репутация
4.226
Реакции
15.341

BMWRC-news.gif

Голос из пробирки: OpenAI приблизила наше синтетическое будущее

1 апреля, 2024

15 секунд – и вы овладеете любым языком, даже не умея говорить.
image

OpenAI - это компания, которая занимается исследованиями и разработкой в области искусственного интеллекта. Она была основана в 2015 году и создана с целью сделать искусственный интеллект более доступным и безопасным для людей. Компания разрабатывает и использует нейронные сети и другие методы искусственного интеллекта для решения различных задач, включая анализ данных, генерацию текста, голоса, изображений и т.д.
OpenAI представила первые результаты работы над уникальной разработкой – моделью Voice Engine. Технология способна генерировать естественно звучащую речь, идентичную оригинальному голосу диктора, используя всего лишь текст и 15-секундную аудиозапись. Небольшая модель способна создавать эмоциональные и реалистичные голоса.

Разработка Voice Engine началась в конце 2022 года. Модель уже находит применение в API преобразования текста в речь, а также в функциях ChatGPT Voice и Read Aloud. Вместе с тем, OpenAI осуществляет осторожный подход к более широкому распространению технологии, учитывая потенциал неправомерного использования синтетических голосов. Компания стремится инициировать диалог о безопасном внедрении синтетических голосов и адаптации общества к новым возможностям.
Среди ранних применений Voice Engine:

  • помощь в чтении для неграмотных и детей с использованием естественных и эмоциональных голосов;
  • перевод контента (видео и подкасты) для расширения глобальной аудитории;
  • улучшение предоставления основных услуг в отдаленных районах;
  • поддержка людей с заболеваниями, влияющими на речь, через терапевтические и образовательные приложения;
  • восстановление голоса у пациентов, страдающих от внезапных или дегенеративных состояний речи.

OpenAI подчеркивает серьезность рисков, связанных с генерацией речи, идеально имитирующей голоса людей, особенно в контексте выборов. В ответ на риски компания разработала меры безопасности, включая водяные знаки для отслеживания происхождения аудио, созданного Voice Engine, и активный мониторинг использования технологии. Партнеры, тестирующие Voice Engine, согласились с политикой использования, запрещающей имитацию другого лица или организации без согласия.
Компания предлагает шаги к повышению устойчивости общества к вызовам, представляемым убедительными генеративными моделями, включая пересмотр аутентификации на основе голоса как меры безопасности и разработку политик защиты использования чужих голосов в ИИ. OpenAI стремится к продолжению диалога о вызовах и возможностях синтетических голосов с политиками, исследователями, разработчиками и креативщиками, подчеркивая важность глобального понимания направления развития технологии.
 
Назад
Сверху Снизу