ИИ способный клонировать голоса

OpenAI представила модель искусственного интеллекта, способную клонировать голос за 15 секунд.

апр 1, 2024 - 12:16
ИИ способный клонировать голоса

OpenAI представила Voice Engine, модель искусственного интеллекта, которая обещает революцию в области транскрипции речи. Этот продукт, вышедший после двухлетнего периода разработки, способен реплицировать любой голос, просто прослушав короткий аудиосэмпл длительностью 15 секунд. Этот значительный технологический прогресс вызывает некоторую тревогу.

Согласно официальной информации компании, Voice Engine был обучен на лицензионных записях голоса и общедоступных базах данных, и поэтому не вызывает проблем с авторскими правами. Однако на данный момент OpenAI не планирует широко распространять эту технологию из-за рисков неправильного использования.

В блог-посте, опубликованном OpenAI, содержится информация о мотивации создания этой технологии. Среди причин перечисляются помощь в чтении для людей с нарушениями зрения или трудностями в чтении, возможность перевода и дубляжа для людей, говорящих на разных языках, а также помощь для людей с нарушениями речи. Кроме того, Voice Engine предлагает новые инструменты для производителей контента и открывает двери для исследований в областях, связанных с языком и логопедией.

Как работает Voice Engine?

После анализа 15-секундной аудиозаписи Voice Engine приступает к обработке тона голоса и других характеристик звука, создавая синтетический голос, практически неотличимый от оригинала. Ограниченный доступ к этой модели искусственного интеллекта свидетельствует о высокой степени сходства синтетического голоса с оригиналом.

Однако существуют значительные потенциальные угрозы, связанные с использованием Voice Engine. Среди них мошенничество, кража личных данных, дезинформация и создание дипфейков. OpenAI заявляет, что активно работает над решением этих проблем и планирует провести консультации с авторитетными лицами и экспертами перед тем, как сделать Voice Engine доступным для широкого использования.

Разработка Voice Engine также вызывает серьезные этические и юридические вопросы. Контроль за такими мощными моделями искусственного интеллекта и защита их от неправомерного использования становятся ключевыми аспектами, которые необходимо решить в ближайшем будущем. Примеры клонированных звуков можно прослушать на странице блога OpenAI.