Midjourney: погружение в воображаемые миры
Как итог
Несмотря на то что нейронные сети быстро учатся, они ещё не могут разбираться в исторических и культурных реалиях. И здесь бывает много смешных ошибок. Например, три одновременно надетых православных крестика, ордена за военные заслуги, распределённые по всему мундиру, нелепая шляпка, не соответствующая эпохе. Именно поэтому нейросетям лучше всего даются вымышленные, фантастические сюжеты.
Чем точнее описан запрос, тем более детальнее и красочнее получается рисунок. Можно указывать что угодно, задний фон, количество объектов, характеристики объектов и многое другое.
Например, ей можно задать запрос генерации корабля, летающего в облаках, и она выполнит рисунок.
Режимы Style от low до high задают, насколько творчески сеть должна подходить к технике рисунка. Чем более высокий уровень выставлен в настройках, тем свободнее будет стилизация изображения. Эффект может быть интересным, но управлять фантазией нейросети сложно.
Midjourney сегодня ― один из лучших инструментов для создания изображений при помощи искусственного интеллекта. Алгоритмы сети постоянно совершенствуются и хорошо интерпретируют задания пользователей. Нейросеть по-прежнему совершает ошибки, которые выявить становится всё более сложно. К сожалению, сейчас её бесплатные возможности сильно ограничены, но недорогая подписка предоставляет широчайшие возможности для использования заложенного в сеть функционала.
Midjourney может создавать картины, делать стилизации в духе популярных фильмов, а также выдумывать облики сказочных существ. Если раньше для того, чтобы заниматься графикой, требовался талант или специальное образование, то благодаря Midjourney воплощать свои графические идеи смогли даже те, кто вообще не умеет рисовать.
Нейросети хорошо справляются с крупными планами, поскольку они содержат меньше деталей. Ведь чем больше разнородных элементов на картинке, тем сложнее не ошибиться в их воспроизведении. По этой же причине нейросети почти всегда размывают фон за главным героем.
Работа любой нейросети схожа по своей сути с работой человеческого мозга, отсюда и пошло название “искусственный интелект”. Как и у человеческого мозга, внутри нейросети есть цепочка, выстроенная из нейронов. Они изучают новый объект, исследуют его, а затем, на основе полученной информации учатся, дополняют её новыми знаниями, допускают ошибки и исправляют их.
Нейросеть Midjourney работает на основе двух научных достижений в области работы над ИИ ― возможности распознавать человеческую речь и умении создавать картинки и образы. Программа использует глубокое обучение и выстраивает взаимосвязи между введённым запросом от человека и данными из огромной загруженной в неё библиотеки.
Анатомия человека
При бесплатной подписке на полученные изображения действует лицензия Creative Commons Noncommercial 4.0 Attribution International. Таким образом, делиться, изменять и распространять результаты работы нейросети можно с указанием источника, а коммерческое использование ― запрещено.
Попытки создать подобную программу были и раньше. Например, приложение Prisma превращало фотографии в «картины», используя стили знаменитых художников. Несмотря на успех Prisma, Midjourney выигрывает как в популярности, так и в функциональности. Эта нейросеть может не только копировать и применять стили, но также создавать собственные изображения с нуля и даже имитировать фото.
Всё это делается на основе искусственного интеллекта, обученного на огромном количестве фотографий в сети интернет. Как только Midjourney найдёт наиболее подходящие снимки из имеющихся, она может создать из них композицию. Если пользователь не указал, на какую тему должно быть сделано изображение, то Midjourney сама выберет подходящую.
Нейронные сети по своей структуре имитируют нервную систему. Они состоят из множества нейронных процессоров — «узлов» по типу нейронов в мозге. Каждый из узлов может анализировать данные, полученные при взаимодействиях с человеком или другими узлами. В результате современные нейросети могут самостоятельно обучаться, находить ошибки в своей работе и применять предыдущий опыт.
Пока что нейросети не до конца научились делать симметричные объекты, поскольку не совсем понимают, что же они рисуют. За время обучения алгоритмы хорошо усваивают, как устроены лица и морды животных, симметрия тела и насекомых. При этом им пока что не под силу опознать устройство, например, человеческой одежды. Нередко пиджаки имеют полы разной длины, левая часть предмета не соответствует правой. Симметричные узоры также выглядят идеальными лишь на первый взгляд ― творчество нейросети в них выдаёт несовпадение в мелочах, если приглядеться.
В нынешнее время нейросети являются отличным подручным средством для людей, работающих с данными и информацией. Сейчас умные программные обеспечения умеют писать тексты, редактировать фотографии, создавать картинки по запросу, генерировать видеоролики. Нейросети применяются в компьютерах автомобилей и машинном обучении. В голосовых помощниках и умных устройствах.
В одной из статей мы уже описывали некоторые нейросети и принципы их работы. Сегодня хотелось бы поведать о одной из самых известных нейросетей на данный момент.
Многие думают, что если изображение создала нейросеть, то права на него автоматически принадлежат пользователю-автору, ведь нейросеть ― это технология и обладать авторскими правами она не может. Но всё не так просто. Разработчики вложили в создание сети немало ресурсов, а сама Midjourney принадлежит компании Midjourney Inc.
В 2022 году Хани Фарид, профессор из Калифорнийского университета в Беркли, и Софи Найтингейл из Ланкастерского университета в Англии провели исследование. В его ходе они предлагали испытуемым определить, какой портрет сделан при помощи фотографии, а какой ― нейросетью. По итогам выяснилось, что участники смогли определить настоящие лица лишь с точностью в 48,2%.