10 мин.
0

Как создавать музыку через ИИ: инструкция

Долбит нормально.

Музыка всегда была способом выразить эмоции, но до недавнего времени создать настоящую песню мог только человек с образованием или серьезным уровнем навыков. Сегодня же любой желающий способен сделать трек за несколько минут, даже если никогда не занимался музыкой. В этом тексте мы с вами разберем лучшие сервисы и покажем, как с помощью ии написать песню, начиная от идеи до готового результата.

Какую нейросеть выбрать: 5 лучших ИИ

Suno AI

Самая популярная нейросеть для создания музыки в мире. Она умеет генерировать треки с нуля, по заданному тексту или на основе загруженной композиции. ИИ также позволяет редактировать уже существующие записи и достраивать песню до любой длительности, работая с огромным набором жанров.

Главная особенность Suno – бесплатный функционал. Если вам нужно просто попробовать, как создавать музыку через ИИ, или сделать шуточный трек для друзей, бесплатного тарифа хватит с запасом. В нем доступны почти все возможности, а главное ограничение – 10 генераций в день, что довольно щедро. Платная подписка (от 10 долларов в месяц) снимает лимиты и, что особенно важно, передает вам коммерческие права на созданные композиции. Вы сможете продавать свою музыку, загружать ее на стриминговые платформы (если это не противоречит их правилам) или использовать в любых других проектах.

Попробовать Suno можно здесь.

Stable Audio

Stable Audio – сервис от разработчиков легендарной Stable Diffusion. Его главная специализация – инструментальные композиции до трех минут и качественные биты. Также нейросеть способна генерировать музыку по текстовому описанию или на основе готового аудио: например, можно взять любую мелодию и добавить к ней несколько сгенерированных фрагментов.

Интерфейс англоязычный. Бесплатная версия позволяет создавать до 10 треков в месяц, подписка стартует с 12 долларов. У сервиса есть две версии: коммерческая и открытая. Первая делает полноценные треки в разных жанрах, вторая – только короткие сэмплы, зато ее можно захостить на своем сервере и использовать без ограничений. Stable Audio идеально подходит для фоновой музыки в жанрах Lo-Fi, Techno или Ambient. Здесь практически нет артефактов, что выгодно отличает модель от конкурентов, но и музыку со словами создать не получится. Если вы ищете способ сделать музыку через ИИ для фона на видео или подкасте, это один из лучших вариантов.

Попробовать Stable Audio можно здесь.

Udio

Udio – главный конкурент Suno, которого многие люди считают более «музыкальным». В этом ИИ разработчики сделали упор на качество вокала и мелодий: нейросеть выдает очень чистый звук, глубокую проработку инструментов и реалистичные вокальные партии. Если вам нужен сложный джаз, блюз или вокал с характерными эмоциями и придыханием, Udio будет лучшим выбором.

Сервис отлично понимает структуру песни, поэтому с его помощью удобно сочинить песню через ИИ, опираясь на собственный текст и задавая настроение отдельных частей. Бесплатный тариф дает 8 генераций, а платная подписка расширяет возможности и предоставляет права на коммерческое использование. Udio особенно оценят те, кто работает с песнями и текстами, а не просто создает инструментальные заготовки.

Попробовать Udio можно здесь.

GigaChat

GigaChat – нейросеть от «Сбера», которая отлично понимает русский язык, ведь на нем она и обучалась. Она позволяет создавать песни и инструментальную музыку в любых стилях длительностью до трех минут. Процесс максимально прост: вы выбираете жанр, пишете текст (или указываете тему, а ИИ придумает слова сам) и получаете готовый трек. Например, можно создать джазовую композицию о ночном городе или спокойную мелодию о природе.

Сервис полностью бесплатный, ограничений на количество треков нет. Доступен на сайте и через VK и телеграм ботов. Это идеальная точка входа для тех, кто хочет записать песню с помощью ИИ на русском без каких-либо трат и технических сложностей.

Попробовать GigaChat можно здесь.

AIVA

AIVA – один из старейших сервисов на рынке, появившийся еще до бума нейросетей. Его специализация – инструментальная музыка. Нейросеть умеет генерировать треки с нуля, редактировать готовые композиции и создавать несколько вариаций одного произведения. Встроенный MIDI-редактор позволяет редактировать каждую ноту, что будет удобно профессиональным музыкантам.

Интерфейс у сервиса на английском языке. Бесплатный тариф дает возможность сохранить три трека в месяц, подписка стоит от 11 евро. AIVA не генерирует вокал, но пишет музыку на хорошем уровнем – получаются сложные симфонические или электронные аранжировки с точным контролем над каждой деталью. Если ваша цель – создать песню в ИИ с качественным инструменталом, а вокал вы планируете записывать отдельно, можете попробовать AIVA.

Попробовать AIVA можно здесь.

Пошаговая инструкция созданию песен с помощью нейросетей

Прежде чем открывать любой сервис, важно понять, какой именно трек вы хотите получить. Если у вас есть музыкальный опыт, вы можете просто представить результат в голове. Большинству же пользователей проще работать по примеру: найдите композицию, максимально похожую на то, что вы задумали, и ориентируйтесь на нее.

Далее нужно определиться с текстом. Если у вас уже есть готовый материал, используйте его. Перед вставкой в нейросеть обязательно разметьте структуру в квадратных скобках, указав, где будет куплет, где припев, а где – инструментальный проигрыш. Если текста нет, а сочинять с нуля не хочется, попросите любого чат-бота (например, ChatGPT) написать слова в нужном стиле и на заданную тему. Текст, сгенерированный ИИ, обязательно отредактируйте – так он зазвучит живее и естественнее.

После того как выбран референсный трек и подготовлены слова, необходимо описать звучание. Найдите в сети информацию о вашей песне-образце: жанр, темп, настроение, набор инструментов, особенности вокала и другие параметры. Затем «скормите» все эти данные чат-боту и попросите представить их в виде тегов, которые можно использовать в музыкальной нейросети. Например: «Anthemic cinematic rock», «Female vocals, breathy», «128 BPM». Из полученных тегов составьте промт.

Для примера разберем работу в Suno, поскольку это самый популярный сервис, где многие впервые пробуют сделать песню через нейросеть. Зайдите в Suno, нажмите Create и переключитесь из режима Simple в Advanced. Первый режим не дает доступа к ручному вводу текста и тонким настройкам, поэтому для осмысленной работы он не подходит.

Дальше раскройте More Options внизу страницы. Здесь настройте ключевые параметры:

  • Vocal Gender – пол вокала. Если оставить значение по умолчанию, модель определит его автоматически.

  • Lyrics Mode – переключение между генерацией текста и использованием вашего собственного.

  • Weirdness – уровень «экспериментальности», создающий непредсказуемость звука. По умолчанию стоит 50%. Если нужен более узнаваемый, предсказуемый результат, снизьте до 20-30%. Хотите чего-то необычного – повышайте.

  • Style Influence – сила влияния промта из поля Styles на итог. Чем выше значение, тем точнее модель следует жанровым параметрам.

  • Song Title – необязательное поле, но название помогает модели удерживать общий контекст и тему, поэтому лучше указать.

В поле Lyrics вставьте подготовленный текст. Размечайте его с помощью меток вроде:

  • [Intro] – вступление.

  • [Verse], [Verse 2], [Verse 3] – куплеты (нумеруются).

  • [Chorus] – припев (без нумерации).

  • [Outro] – заключение.

  • И других.

Дополнительно можно задавать настроение отдельных сегментов. Например, для хеви-метала финальный припев можно сделать более мощным, если прописать [Chorus – powerful]. Для меланхоличной баллады подойдет [Verse – soft, sad], и так далее. Просто подберите подходящее слово и укажите его рядом с нужной частью трека.

Затем скопируйте подготовленный промт (теги, описывающие звучание) в поле Styles и нажмите Create. В бесплатном режиме Suno выдаст два варианта трека, в платном – четыре. Прослушайте все и выберите лучший. Для большинства задач этого достаточно, и теперь вы знаете, как создать песню с помощью нейросети. Если результат не устроил, не расстраивайтесь, а повторите генерацию. Модель предсказывает звуковые паттерны, а не выполняет команды буквально, поэтому иногда для создания качественного трека требуется несколько попыток. Это нормальная часть творческого процесса.

Примеры промтов

С промтами для музыкальных нейросетей все обстоит сложнее, чем с генерацией изображений или видео. Данных для обучения у них меньше, обучать на этих данных сложнее. Поэтому технология развита не так глубоко, и один и тот же запрос при каждой генерации может давать совершенно разные результаты. К тому же музыкальные вкусы у всех разные, и универсального рецепта не существует.

Вместо готовых примеров промтов лучше используйте формулу для написания собственного промта:

  • Жанр – все понятно из названия, но помните, что нужно использовать максимально точное определение. Помните, что Rock, Rockabilly  и Surf Rock – разные жанры.

  • Темп – лучше указывать не словами, а количеством ударов в минуту (BPM). Например, 120 BPM – довольно быстрый трек, 80 – умеренный, а 60 – медленный.

  • Настроение – также, как и с жанром: чем точнее, тем лучше. Sad и Melancholic создадут, похожую, но все-таки разную атмосферу.

  • Инструменты – перечислите инструменты и укажите, какой из них главный, какой звучит громче, а какой тише и так далее.

  • Стиль вокала – опишите тип голоса и, по желанию, на какую песню он должен быть похож.

  • Эра – отсылка к звучанию определенного времени, например, «80s synthwave» или «90s hip-hop».

  • Референс – можно указать, на что в целом должен быть похож ваш трек.

Соберите промт по этой формуле, и вы сможете создать песню в ИИ с гораздо более предсказуемым и качественным результатом, чем при интуитивном вводе описания. Например, у меня получился: Shoegaze, 105 BPM, bittersweet nostalgic, washed-out electric guitars high in mix, soft analog synths background, distant drum machine, female vocals breathy, early 90s sound, similar to My Bloody Valentine.

***

Создаем ИИ-видео: от фото до готового ролика

Как отредактировать фото с помощью нейросетей: руководство