Содержание статьи
Как пользоваться Midjourney для генерации картинок и правильно составлять запросы
Закажите разработку нейросети уже сегодня
Как устроен дискорд-сервер Midjourney. Главных каналов несколько: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах. Советую заодно ознакомиться с правилами в канале Rules, чтобы не возникало вопросов, если вас вдруг за что-то забанят.
—no. Параметр, в котором можно прописать, чего на картинке быть не должно. Например, —no plants — рисовать сюжет без растений. Но важно учесть, что нежелательные предметы надо еще правильно назвать: хеллоуинская ведьма с параметром —no hat все еще будет в остроконечном колпаке. Потому что колпак называется witch’s hat — вот его-то и надо исключать.
Уровень зарплат программистов от региона к региону отличается незначительно. Причиной тому является возможность удалённой работы. Но, тем не менее, зарплаты программистов в среднем достаточно высоки и превышают средние по регионам в 2-3 раза, а если говорить о Москве и Санкт-Петербурге, то находятся в верхней части рейтинга. По состоянию на октябрь 2021 года, программист достаточной квалификации на рынке труда в среднем стоит 100-150 т.р. в месяц без учёта налогов.
Как получить доступ к Midjourney. Сейчас Midjourney можно пользоваться в виде бота в «Дискорде», возможность генерации на сайте пока в стадии постепенного запуска. Так что вам придется зарегистрироваться на платформе. Midjourney работает как бот в этом мессенджере. Чтобы сгенерировать картинку, нужно каждый раз отправлять запрос в чат с Midjourney Bot.
В основе сервера — пространства для генерации изображений. В «Дискорде» есть каналы Newcomer Rooms, внутри которых — сотни чатов Newbies. Именно в них создают картинки пользователи, которым нравится творить в большой компании. Выбирайте любой из чатов, в идеале — чтобы одновременно с вами там сидело не очень много людей. Вы будете видеть все их попытки создать картинку при помощи нейросети, а они — ваши.
Работу нейронной сети можно сравнить с биологической деятельностью человеческого мозга, где нейронная структура воссоздается с помощью кода. При этом «нервные импульсы» в ней представлены в качестве математических формул и чисел. Связи между элементами нейросети также организованы программно. При распространении информации меняется коэффициент внутри нейронов, провоцируя процесс глубокого изучения.
Какие задачи решает нейросеть
В связи с ростом мощности техники в сегодняшних нейросетях используется большое количество слоев, которое помогает им справиться с крупными объемами данных. В Deep learning используются Keras, Detectron, PyTorch и другие специальные фреймворки.
Нейронные сети – это отличная альтернатива алгоритмам распознавания речи, музыки, изображений, объектов на фото и видео, а также машинному переводу. Они относятся к машинному обучению (ML). Нейросети широко применяются в глубоком обучении (Deep learning), который является одним из видов ML.
Под сгенерированными изображениями появятся кнопки «U1, U2, U3, U4» и «V1, V2, V3, V4». Первый параметр — апскейлинг. Выберите наиболее удачную картинку из четырех, и нейросеть выдаст ее отдельно и покрупнее. Второй параметр позволяет создать еще четыре вариации конкретной картинки из коллажа — на случай, если вам нравится результат, но хочется посмотреть, что еще сделает нейросеть в том же духе.
Как сохранить картинку. Можно скачать результат прямо из чата в «Дискорде». На компьютере пункт «Сохранить изображение» будет в меню при клике правой кнопкой мыши — как прямо в чате, так и если открыть в нем картинку отдельно. На смартфоне надо тапнуть на изображение, а когда оно откроется — на три точки в правом верхнем углу, там будет пункт «Сохранить».
Пункт 7 (интеграция в продукт или программный стек заказчика) может как не стоить ничего, если заказчик обладает достаточной компетенцией для интеграции и использования программного модуля самостоятельно, так и превысить в цене все остальные пункты вместе взятые (иногда заказчику требуется разработать целую распределённую инфраструктуру, в которой нейросеть является лишь элементом).
Нейросетей для генерации качественных изображений становится все больше. Но Midjourney прочно держится в числе лучших. Вот ее преимущества: высокий уровень фотореализма, работа через «Дискорд» на любом устройстве без требований к производительности, возможность доработки изображений и гибкой настройки параметров.
Сейчас нейросети применяются в различных сферах как повседневной жизни, так и профессиональной деятельности, но особый интерес разработка нейросети представляет для бизнеса, так как она помогает в автоматизации многих процессов. Используется в следующих цифровых продуктах:
Наиболее неопределёнными в плане трудозатрат, а соответственно стоимости, и, в то же время, определяющими результат работы, являются этапы формирования и разметки обучающей выборки. Например, для обучения нейросети распознаванию повербанков на рентгеновских изображениях прийдётся прогнать через рентгентелевизионную установку 5-10 тысяч повербанков, после чего вручную обвести их на изображениях — работа не требующая квалификации, но трудозатратная, и, к тому же, требующая тщательного контроля — качество разметки и отсутствие ошибок или неточностей напрямую влияет на точность нейросети.
Для чего используют нейросети
—seed. Это числовой код, который присваивается каждой генерации. Его указывают в запросе, когда надо создать несколько картинок с разным сюжетом, но сходным визуальным стилем и композицией. Чтобы узнать seed, отреагируйте на картинку эмодзи с конвертом и посмотрите номер в личном сообщении, которое пришлет бот.
Описывайте сцену подробно. Чем больше деталей, тем точнее будет результат. Нейросеть плохо понимает расплывчатые усилители в запросе. «Суперъяркий» или «красивый» не сообщают ничего о том, что и как должно быть нарисовано. Хороший промпт — ясный и точный, с визуальными деталями. Вот как его формулировать:
Если генерируете в Midjourney v4 или v5 , запрос надо строить иначе. В старых версиях нейросеть учитывает описания меньшей длины и жестко ранжирует весомость слов: сначала надо сказать главное, потом через запятую добавлять детали. Например, corgi biker on a motorcycle , leather clothing, vintage motorcycle, sunset, photorealism. Начиная с Midjourney v6 лучше работают естественные описания, хотя старые промпты все еще могут давать хорошие результаты.
В активные часы в канале могут появляться сотни сообщений в час, и ваши работы явно затеряются. Тут поможет кнопка «Почта» в правом верхнем углу «Дискорда»: бот упоминает вас при каждой генерации картинки, все уведомления от него можно посмотреть в отдельном окне.
Стало: a confident corgi biker, dressed in a miniature leather jacket, custom-fit helmet with goggles, and a whimsical bandana, striking a pose on a classic Harley-Davidson motorcycle. The scene is set on an open road, cutting through a breathtaking landscape at sunset , with the warm glow of the setting sun illuminating the scene, creating long shadows and a sense of boundless freedom. The composition focuses on the corgi’s adventurous spirit, with a blurred background to emphasize the main subject.
Но к таким ботам нужно относиться осторожно: за названием Midjourney в «Телеграме» может скрываться любая нейросеть или вообще уже готовая база сгенерированных картинок. Тем более что боты преимущественно платные — после пары тестовых попыток появляются предложения купить премиум.
Используйте изображения как референс. В запрос можно добавить прямую ссылку на картинку, которая вам нравится, или даже несколько. При генерации нейросеть учтет не только слова в запросе, но и эти изображения. Можно указать, насколько весомым должен быть вклад референса, с помощью параметра —iw. Подробнее — в разделе с полезными короткими командами.
Как итог: стоимость создания нейросети начинается от двух миллионов рублей «под ключ», в случае если речь идёт о простой нейросети и не затратной процедуре подготовки обучающей выборки и достигает 6-9 миллионов рублей в случае необходимости разработки «экзотической» архитектуры нейросети и затратной процедуре подготовки обучающей выборки. Большую стоимость разработки именно нейросети «честно» обосновать вряд ли возможно в ценах 2020 года, общая цена работы может вырасти только за счёт работ, не относящихся непосредственно к разработке нейронной сети — разработки программного обеспечения, частью которого является нейросеть (аналитика, отчёты, базы данных, порталы, инфраструктура и рабочие места пользователей).