Fish

Fish Audio — передовая AI-платформа для синтеза речи и клонирования голоса, разработанная для создания естественно звучащих голосов из текста. Платформа переименована в OpenAudio с выпуском новой серии моделей (OpenAudio-S1), обучённых на более чем 1 млн часов аудио в различных языках. Fish Audio позиционируется как доступная профессиональная альтернатива ElevenLabs и Speechify, предоставляя ультра-низкую задержку (менее 150 мс) и 99% точность голосового клонирования для создателей контента, разработчиков, подкастеров и игровых компаний.

Платформу используют видеомонтажёры, подкастеры, разработчики приложений, создатели контента, дизайнеры игр и предприятия. Fish Audio выделяется мгновенным клонированием голоса (15-30 сек аудио), поддержкой 13+ языков, реальным временем синтеза речи, библиотекой более 200 000 голосовых моделей, открытым исходным кодом Fish-Speech (Apache License), настройкой эмоций и интонаций, и доступным API для программной интеграции.

Особенности:

Текст-в-речь: преобразование текста в естественно звучащую речь с поддержкой 13+ языков.
Голосовое клонирование: создание точной копии голоса за 15-30 секунд записи с 99% точностью.
Ультра-низкая задержка: синтез речи в реальном времени с задержкой менее 150 миллисекунд.
200K+ голосовых моделей: доступ к библиотеке голосов от сообщества для использования.
Настройка эмоций: контроль эмоций, интонаций, пауз и смеха в сгенерированной речи.
Открытый исходный код: Fish-Speech с лицензией Apache 2.0 для локального развёртывания и интеграции.
REST API: программный доступ для встраивания синтеза речи в приложения и сервисы.

Ссылки:

Записей не найдено.