Компания ElevenLabs официально выпустила Music v2 — обновленную модель для генерации музыки, которая обещает значительно более высокий уровень контроля над композицией и качеством звука. Согласно The Decoder, новая итерация алгоритма способна поддерживать музыкальную связность даже при радикальной смене жанров внутри одного трека, например, при переходе от классической оперы к тяжелому металу.
Разработчики сфокусировались на улучшении вокальных партий, инструментальных аранжировок и общей структуры произведений. Модель демонстрирует уверенную работу с быстрой читкой в рэпе и органичное внедрение звуковых эффектов в полотно композиции. Подобная гибкость намекает на то, что эпоха односложных генераций, ограниченных одним стилем, постепенно уходит в прошлое, уступая место динамическим структурам.
Инструменты для точечного редактирования
Одной из наиболее востребованных функций в Music v2 стало улучшенное инпеинтинг (inpainting) — возможность регенерировать только выбранные фрагменты аудиозаписи. Это позволяет авторам работать над песней итерационно, исправляя неудачные такты или меняя слова в куплете, не затрагивая при этом удачную аранжировку в остальной части трека. Такой подход превращает ИИ из «черного ящика», выдающего случайный результат, в полноценную рабочую станцию.
Техническая база модели опирается на расширенную многоязычную поддержку, что упрощает создание локализованного контента. ElevenLabs интегрировала Music v2 в три ключевых направления: сервис ElevenMusic для индивидуальных творцов, ElevenAPI для разработчиков программного обеспечения и платформу ElevenCreative, ориентированную на маркетинговые агентства и бренды.
ElevenLabs делает ставку на легальность через партнерство с Believe, что критически важно для индустрии. Однако ограничение битрейта в 192 кбит/с остается узким местом для профессионального постпродакшена, превращая инструмент скорее в продвинутый черновик, чем в финальный мастер-диск. Технология опережает стандарты качества передачи, и это главный парадокс текущего момента.
Доступность и этика обучения
Вопрос легальности обучающих выборок остается острым углом в индустрии генеративного ИИ, и ElevenLabs постаралась его сгладить. Компания утверждает, что модель обучалась исключительно на лицензированном контенте. В частности, часть данных была получена в рамках партнерства с музыкальной компанией Believe, что позволяет пользователям платных тарифных планов (начиная с уровня Starter) использовать сгенерированные треки в коммерческих целях.
Для тех, кто планирует встраивать генерацию музыки в свои приложения, стоимость использования API установлена на уровне $0,15 за минуту аудио. Максимальная длительность одного трека ограничена пятью минутами, а итоговое качество составляет 44,1 кГц. Хотя эти параметры могут показаться скромными для студийных аудиофилов, для нужд создателей контента в социальных сетях и разработчиков игр этого вполне достаточно.
Постепенное развитие подобных инструментов неизбежно меняет роль композитора, превращая его из исполнителя в куратора и редактора смыслов. Остается лишь наблюдать, как быстро профессиональное сообщество адаптирует эти возможности под свои задачи, не теряя при этом индивидуального творческого почерка в потоке алгоритмически безупречных, но порой предсказуемых мелодий.
Оставить комментарий