Содержание статьи
Midjourney: погружение в воображаемые миры
Что такое Midjourney
Midjourney может создавать картины, делать стилизации в духе популярных фильмов, а также выдумывать облики сказочных существ. Если раньше для того, чтобы заниматься графикой, требовался талант или специальное образование, то благодаря Midjourney воплощать свои графические идеи смогли даже те, кто вообще не умеет рисовать.
Пока что нейросети не до конца научились делать симметричные объекты, поскольку не совсем понимают, что же они рисуют. За время обучения алгоритмы хорошо усваивают, как устроены лица и морды животных, симметрия тела и насекомых. При этом им пока что не под силу опознать устройство, например, человеческой одежды. Нередко пиджаки имеют полы разной длины, левая часть предмета не соответствует правой. Симметричные узоры также выглядят идеальными лишь на первый взгляд ― творчество нейросети в них выдаёт несовпадение в мелочах, если приглядеться.
Очень часто нейросети изображают руки с большим количеством пальцев, положение которых далеко от физиологичного. Проблема частично устранена только в последней версии Midjourney, при более ранних версиях приходилось использовать сторонний плагин, исправляющий эту ошибку.
При бесплатной подписке на полученные изображения действует лицензия Creative Commons Noncommercial 4.0 Attribution International. Таким образом, делиться, изменять и распространять результаты работы нейросети можно с указанием источника, а коммерческое использование ― запрещено.
Режимы Style от low до high задают, насколько творчески сеть должна подходить к технике рисунка. Чем более высокий уровень выставлен в настройках, тем свободнее будет стилизация изображения. Эффект может быть интересным, но управлять фантазией нейросети сложно.
Нейросеть Midjourney работает на основе двух научных достижений в области работы над ИИ ― возможности распознавать человеческую речь и умении создавать картинки и образы. Программа использует глубокое обучение и выстраивает взаимосвязи между введённым запросом от человека и данными из огромной загруженной в неё библиотеки.
Шаг 8: создание картинки
Многие думают, что если изображение создала нейросеть, то права на него автоматически принадлежат пользователю-автору, ведь нейросеть ― это технология и обладать авторскими правами она не может. Но всё не так просто. Разработчики вложили в создание сети немало ресурсов, а сама Midjourney принадлежит компании Midjourney Inc.
На базовом тарифе можно генерировать изображение суммарно чуть более трёх часов, причём только в ускоренном режиме. Тариф Standart стоит 30 долларов в месяц, в нём доступна опция медленной загрузки процессора, и время для генерации изображений не ограничено.
Когда заходите через собственный сервер, ваши работы доступны всем пользователям, но не в режиме реального времени и общем чате, а на сайте-галерее. В остальном способы работы через общий и отдельный сервер совпадают — от базовых команд до времени, которое уходит на создание изображения.
К другим командам относят /show для просмотра ID, /ask для получения ответов на вопросы, /fast для переключения на быстрый режим. Чтобы использовать все команды, необходимо купить один из тарифов. Однако для простой генерации изображения достаточно бесплатной версии.
Midjourney сегодня ― один из лучших инструментов для создания изображений при помощи искусственного интеллекта. Алгоритмы сети постоянно совершенствуются и хорошо интерпретируют задания пользователей. Нейросеть по-прежнему совершает ошибки, которые выявить становится всё более сложно. К сожалению, сейчас её бесплатные возможности сильно ограничены, но недорогая подписка предоставляет широчайшие возможности для использования заложенного в сеть функционала.
Разработчики нейросетей редко используют термин «искусственный интеллект», они придерживаются понятия «машинное обучение». Суть его не в решении задачи по конкретному алгоритму, а в создании алгоритма на основе многих аналогичных задач. Ещё один термин ― «глубокое обучение» (с англ. «deep learning»). Это одно из направлений машинного обучения, которое работает с большим объёмом данных (big data) для поиска закономерностей и взаимосвязей.