Как искусственный интеллект видит песни

0
15

Нейросеть Suno AI: пишем хиты в пару кликов

Как с помощью Suno сгенерировать музыку

Нейросеть генерирует полноценные песни длительностью до двух минут, знакома практически со всеми популярными жанрами и поддерживает русский язык. Так что если вы мечтали услышать рэп-версию песенки мамонтёнка или хиты Валерия Сюткина в исполнении AC/DC, то Suno — это то, что надо.

Разработчики Soundraw добавили ряд инструментов для редактирования сгенерированных композиций. Нейросеть создаёт многоканальную запись и разделяет трек на логические части: вступление, куплеты, развязку, финал и другие. К примеру, в специальном меню можно полностью убрать бас в начале, а в припевах добавить больше ударных.

«Процесс «творчества» начинается с обучения: нейросети «показывают» большое количество музыкальных произведений, созданных человеком, она находит в них закономерности, а потом на основе этих данных создает что-то похожее, – рассказывает руководитель службы развития технологий медиасервисов «Яндекса» Анатолий Старостин. – Например, в 2019 году нейросеть «Яндекса» проанализировала 4 ГБ классической музыки — от Баха до Шнитке — и написала пьесу, которую впоследствии исполнил оркестр «Новая Россия»».

А еще специалисты компании учат нейросети писать персонализированные треки. В рамках одного проекта программисты создают алгоритмы для генерации композиций, которые смогут решать конкретные задачи человека. Например, помогать сконцентрироваться перед началом работы, зарядиться для занятия спортом или, наоборот, успокоиться. Эти мелодии искусственный интеллект составляет из большой библиотеки звуков: записи отдельных инструментов, эффектов и даже вокальных партий.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В дальнейшем, по мнению специалистов, с помощью нейросетей можно будет создавать мелодии для музыкальной терапии, так как музыка оказывает сильное воздействие на человеческий мозг. Она помогает расслабиться, прийти в тонус или, например, отвлечься от плохих мыслей.

Как ИИ распознает музыку и рекомендует песни?

Также ИИ может удачно рекомендовать песни в стриминговых сервисах. Представим, что мы только что послушали свой любимый трек. Чтобы предложить нам следующую композицию, нейросети сравнивают нашу песню с миллионами других. В частности, ИИ анализирует большое количество спектрограмм, находит в них закономерности и с высокой точностью определяет, похожи ли два трека по жанру, используемым инструментам и даже по настроению. По сути, такие же процессы происходят и в человеческом мозге: люди отличают рок от джаза, потому что послушали много разной музыки и научились определять признаки того или иного жанра. Разница в том, что ИИ делает это на языке цифр и способен изучить трек гораздо глубже человека — буквально по тысячам параметров — и запомнить не 100 мелодий, а миллионы.

ЧИТАТЬ ТАКЖЕ:  Как купить нейросеть

«Если позволить себе пофантазировать и пойти еще дальше, я вижу не просто умное музыкальное приложение для терапии, а целые адаптивные дома. Было бы здорово иметь системы, способные просканировать эмоциональное состояние человека, как только он перешагнул порог своей квартиры, чтобы включить нужное освещение, поменять цвет стен, выбрать на фоне подходящее музыкальное сопровождение. Я верю, что музыка сильно влияет на здоровье человека. Если понять, как именно использовать ее во благо, технология генерации треков станет незаменимой», — рассуждает Тимур Хазиев.

«Сейчас одна из самых сложных задач – понять, как рекомендовать людям непопулярные треки, – рассказывает руководитель группы рекомендательных продуктов Медиасервисов Яндекса Даниил Бурлаков. – Если у нас есть суперизвестная песня, мы на основании статистики прослушивания можем представить, каким пользователям она будет интересна. Но когда мы имеем дело с треком, который послушало всего 100 человек, предположить, кому еще она может понравиться, гораздо сложнее. Это вопрос объема данных: в отличие от людей, машинам требуется больше информации для обучения. Если ее не очень много, остается только один путь — научить нейросети использовать имеющиеся данные и делать это более эффективно. На этом сейчас сосредоточено много усилий программистов».

Suno хорошо справляется с созданием музыки, умеет работать с любыми жанрами и даже изобретать новые. А вот с текстами дела обстоят значительно хуже. Функция автоматической генерации работает только на английском. Будет ли нейронка обучаться рифмоплётству на других языках, в том числе на великом и могучем, — неизвестно.

В прошлом году команда поставила перед собой еще более амбициозную задачу — перевести в музыку астрономические данные о небесных объектах. Так на свет появился альбом «Музыка звезд». Сначала астрофизики передали разработчикам информацию о космических телах: яркость, периодичность тех или иных явлений, параметры движения. Эти данные были сведены в таблицы, а затем преобразованы в нотный текст.

Сервис платный, и у него нет пробного режима. Самый дешёвый тариф обойдётся в 17 долларов. Этот уровень подписки не позволяет публиковать на стримингах работы, созданные с помощью Soundraw. Перед оплатой можно послушать примеры сгенерированного контента и попробовать режим редактирования. Есть API для разработчиков.

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

«Любую табличную информацию, например, об изменении какого-либо параметра во времени, можно перевести в нотную последовательность, потому что ноты — это, по сути, таблица. Так астрофизики предоставили нам сведения об изменении солнечной активности и количестве пятен на нем, начиная с 1960 года. Мы присваивали этим данным ноты, и таким образом получалась мелодия, — объясняет музыкальный продюсер Тимур Хазиев. — После чего нам оставалось лишь художественно доработать композиции, чтобы передать характер каждого объекта. Черная дыра — это что-то трагическое, мистическое. Солнце — что-то теплое. Так и получился альбом про космос, приуроченный ко Дню космонавтики».

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь