Содержание статьи
Как пользоваться Midjourney для генерации картинок и правильно составлять запросы
Платная подписка Midjourney
Но к таким ботам нужно относиться осторожно: за названием Midjourney в «Телеграме» может скрываться любая нейросеть или вообще уже готовая база сгенерированных картинок. Тем более что боты преимущественно платные — после пары тестовых попыток появляются предложения купить премиум.
Если генерируете в Midjourney v4 или v5 , запрос надо строить иначе. В старых версиях нейросеть учитывает описания меньшей длины и жестко ранжирует весомость слов: сначала надо сказать главное, потом через запятую добавлять детали. Например, corgi biker on a motorcycle , leather clothing, vintage motorcycle, sunset, photorealism. Начиная с Midjourney v6 лучше работают естественные описания, хотя старые промпты все еще могут давать хорошие результаты.
—no. Параметр, в котором можно прописать, чего на картинке быть не должно. Например, —no plants — рисовать сюжет без растений. Но важно учесть, что нежелательные предметы надо еще правильно назвать: хеллоуинская ведьма с параметром —no hat все еще будет в остроконечном колпаке. Потому что колпак называется witch’s hat — вот его-то и надо исключать.
Как получить доступ к Midjourney. Сейчас Midjourney можно пользоваться в виде бота в «Дискорде», возможность генерации на сайте пока в стадии постепенного запуска. Так что вам придется зарегистрироваться на платформе. Midjourney работает как бот в этом мессенджере. Чтобы сгенерировать картинку, нужно каждый раз отправлять запрос в чат с Midjourney Bot.
Нейронные сети – это отличная альтернатива алгоритмам распознавания речи, музыки, изображений, объектов на фото и видео, а также машинному переводу. Они относятся к машинному обучению (ML). Нейросети широко применяются в глубоком обучении (Deep learning), который является одним из видов ML.
Используйте изображения как референс. В запрос можно добавить прямую ссылку на картинку, которая вам нравится, или даже несколько. При генерации нейросеть учтет не только слова в запросе, но и эти изображения. Можно указать, насколько весомым должен быть вклад референса, с помощью параметра —iw. Подробнее — в разделе с полезными короткими командами.
Платная подписка Midjourney
В основе сервера — пространства для генерации изображений. В «Дискорде» есть каналы Newcomer Rooms, внутри которых — сотни чатов Newbies. Именно в них создают картинки пользователи, которым нравится творить в большой компании. Выбирайте любой из чатов, в идеале — чтобы одновременно с вами там сидело не очень много людей. Вы будете видеть все их попытки создать картинку при помощи нейросети, а они — ваши.
—iw. В Midjourney можно загружать картинки в качестве референса — одну или несколько для каждого запроса. И можно указать «вес» — чем больше, тем сильнее картинки будут влиять на результат. Значение по умолчанию — 1 , допустимый диапазон в Midjourney v6 — от 0 до 3, число не обязательно должно быть целым — 0.5 тоже годится.
—cref. Перенос персонажа: можно «переодеть» человека на картинке, поместить его в другую обстановку или создать последовательность сцен с сохранением облика героя. Работает в паре с параметром —cw, который определяет, насколько полно переносить образ. То есть к запросу добавляется конструкция: —cref (прямая ссылка на изображение человека) —cw (от 0 до 100).
Как устроен дискорд-сервер Midjourney. Главных каналов несколько: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах. Советую заодно ознакомиться с правилами в канале Rules, чтобы не возникало вопросов, если вас вдруг за что-то забанят.
В связи с ростом мощности техники в сегодняшних нейросетях используется большое количество слоев, которое помогает им справиться с крупными объемами данных. В Deep learning используются Keras, Detectron, PyTorch и другие специальные фреймворки.
Стало: a confident corgi biker, dressed in a miniature leather jacket, custom-fit helmet with goggles, and a whimsical bandana, striking a pose on a classic Harley-Davidson motorcycle. The scene is set on an open road, cutting through a breathtaking landscape at sunset , with the warm glow of the setting sun illuminating the scene, creating long shadows and a sense of boundless freedom. The composition focuses on the corgi’s adventurous spirit, with a blurred background to emphasize the main subject.
Принцип работы нейросети
Учитывайте весомость каждой части запроса. Те слова, которые идут вначале, сильнее влияют на результат, поэтому основной сюжет лучше указать сразу. Кроме того, можно добавлять «веса» к разным частям запроса через двойное двоеточие: corgi on a motorcycle as Marvel hero::5, cinematic shot::5, epic shot::2. Если пишете подробный запрос, это не требуется.
Как сгенерировать свое первое изображение. Зайдите в один из чатов Newbies и введите в поле для отправки сообщения команду /imagine. Появится плашка Prompt: все, что вы напишете после нее, станет частью запроса. Описание картинки для нейросети лучше формулировать на английском языке. Другие языки Midjourney понимает гораздо хуже. Если не знаете английский, пользуйтесь нейросетевым переводчиком DeepL.
Наиболее неопределёнными в плане трудозатрат, а соответственно стоимости, и, в то же время, определяющими результат работы, являются этапы формирования и разметки обучающей выборки. Например, для обучения нейросети распознаванию повербанков на рентгеновских изображениях прийдётся прогнать через рентгентелевизионную установку 5-10 тысяч повербанков, после чего вручную обвести их на изображениях — работа не требующая квалификации, но трудозатратная, и, к тому же, требующая тщательного контроля — качество разметки и отсутствие ошибок или неточностей напрямую влияет на точность нейросети.
—seed. Это числовой код, который присваивается каждой генерации. Его указывают в запросе, когда надо создать несколько картинок с разным сюжетом, но сходным визуальным стилем и композицией. Чтобы узнать seed, отреагируйте на картинку эмодзи с конвертом и посмотрите номер в личном сообщении, которое пришлет бот.
В активные часы в канале могут появляться сотни сообщений в час, и ваши работы явно затеряются. Тут поможет кнопка «Почта» в правом верхнем углу «Дискорда»: бот упоминает вас при каждой генерации картинки, все уведомления от него можно посмотреть в отдельном окне.
Сегодня искусственные нейронные сети применяются для решения самых разных задач и, казалось бы, ими можно заменить человека практически во всем спектре направлений, где требуется творчество, принятие решений или анализ. К тому же, во всемирной сети содержится большое количество «нейронных сетей», доступных для свободного скачивания, которые, вроде бы, осталось только обучить.