ТЕХНИКА  ИИ пришёл за композиторами

Stability AI представили искусственный интеллект, который пишет музыку по текстовому запросу. Сэр Брайан Мэй высказал глубокую озабоченность по поводу перспектив человека в музыке

Разработчик генеративных ИИ Stability AI, более всего известный генератором изображений StableDiffusion, представил новый продукт, Stable Audio. Уже само название может вызвать озабоченность у музыкантов и композиторов. Да, это генератор "полноценных" музыкальных произведений с готовой аранжировкой. Правда, очень коротких.

Stable Audio использует плюс-минус ту же диффузную модель ИИ, что и генератор изображений StableDiffusion, созданный Stability.

StableDiffusion обучался на графических изображениях, Stable Audio - на аудиозаписях.

Характерной особенностью диффузных моделей, генерирующих аудио, - это жёсткая фиксированность продолжительности выходного аудиотрека. Если в модели обучения использовались, например, 30-секундные фрагменты, то более продолжительной композиции машина не создаст. Но для практического музыкального производства такое не подходит.

Как пишет издание The Verge, новая платформа Stability AI от этого недостатка избавлена. Она позволяет задавать нужную продолжительность готового трека - правда, лишь в определённых рамках.

В Stability AI утверждают, чт Stable Audio обучался на основе массива данных, включавших 800 тысяч аудиофайлов, в числе которых - музыкальные записи, звуковые эффекты и изолированные дорожки отдельных музыкальных инструментов. В общей сложности это 19,5 тысяч часов звучания.

Текстовые метаданные предоставила компания AudioSparx, которая лицензирует "стоковую" музыку. Партнёрство с этой фирмой позволило совершенно легально использовать при обучении защищённые копирайтом материалы.

Для поставщиков генеративных ИИ подобное становится всё более существенным вопросом: несколько художников подали иски против поставщиков ИИ-генераторов изображений, обвиняя тех в использовании своих работ без ведома и разрешения. Количество присоединившихся к иску растёт. Вполне вероятно, что и Stable Audio вызывал бы претензии у композиторов.

Stable Audio предлается в трёх версиях. Бесплатная позволяет генерировать по текстовым запросам до 20 музыкальных треков в месяц продолжительностью не более 45 секунд. Коммерческое использование при этом исключено.

"Профессиональная" версия позволяет генерировать до 500 треков продолжительностью по 90 секунд каждая.

Будет также и "корпоративная" (Enterprise) версия, где клиенты сами будут выбирать, какие записи делать и сколько за это платить.

Stable Audio - первая такая платформа, доступная публично. Meta объявила о запуске своей ИИ-платформы для создания аудио в августе, но там доступ возможен только исследователям и небольшому количеству избранных аудиопрофессионалов. MusicLM от Google также пока доступен только исследователям.

Впрочем, доступность Stable Audio на данный момент тоже снижена: с момента запуска сайт претерпел такой наплыв трафика, что едва справлялся с запросами.

В течение нескольких дней на сайте висело предупреждение о перегрузке, но на момент публикации его уже не было.

Сэр Брайан Мэй (Brian May), сооснователь и гитарист группы Queen (и автор значительной части её материала), в начале сентября выразил глубокую обеспокоенность вторжением генеративных и каких-либо других ИИ в музыкальную сферу.

По его мнению, использование искусственного интеллекта для написания музыки выглядит "чрезвычайно пугающе".

"Думаю, уже к осени следующего года [артистический] ландшафт будет выглядеть совсем по-другому. Мы больше не будем понимать, где что: где музыка, созданная ИИ, а где - сочинённая людьми, - отметил маэстро. - Всё будет выглядеть очень размыто и непонятно, и, может быть, 2023 год станет последним годом, когда на музыкальной сцене будут доминировать люди. И да, я действительно считаю, что всё настолько серьёзно, и это меня решительно не радует. Наоборот, я предчувствую недоброе, готов к тому, что будущее будет очень печальным".

16.09.2023, Юрий ИЛЬИН (ЗВУКИ РУ)

ТЕХНИКА - свежие публикации: