Что вбить в нейросеть

0
17

Как пользоваться Midjourney для гене­рации картинок и правильно состав­лять запросы

Работа через Google Colabotory

Leonardo.Ai создаёт по текстовому запросу изображения, которые можно последовательно менять до достижения нужного результата. Некоторые художники используют эту нейросеть в своём пайплайне вместе со Stable Diffusion: она быстро работает, выдаёт красивые результаты и неплохо понимает промпты.

Вариант подойдёт тем, у кого компьютер не тянет десктопную версию: в этом случае взаимодействие с нейросетью ведётся через облачные серверы Google. Однако каждый раз нужно будет заново подключаться к нейросети. А ещё здесь нет личного кабинета, поэтому сгенерированные картинки не сохраняются и пропадают с новым запросом. Так что всё, что вам понравится, сохраняйте себе на компьютер сразу.

—iw. В Midjourney можно загружать картинки в качестве референса — одну или несколько для каждого запроса. И можно указать «вес» — чем больше, тем сильнее картинки будут влиять на результат. Значение по умолчанию — 1 , допустимый диапазон в Midjourney v6 — от 0 до 3, число не обязательно должно быть целым — 0.5 тоже годится.

Описывайте сцену подробно. Чем больше деталей, тем точнее будет результат. Нейросеть плохо понимает расплывчатые усилители в запросе. «Суперъяркий» или «красивый» не сообщают ничего о том, что и как должно быть нарисовано. Хороший промпт — ясный и точный, с визуальными деталями. Вот как его формулировать:

Генеративные нейросети не могут заменить художника в геймдеве: контролируемый результат от них получить трудно, они часто выдают картинки с кривыми и нелогичными элементами. ИИ-арты должен регулировать и серьёзно дорабатывать опытный специалист, особенно если у игры строгий стиль и железные требования к построению ассетов .

Чтобы нейросеть начала работать, ее нужно научить. Это похоже на то, как маленьким детям объясняют новое. Вот вы показываете ребенку картинки с животными и называете их: корова, кошка, собака, верблюд. Потом ребенок на просьбу «покажи верблюда» сам показывает вам правильную картинку. Так же работает и нейросеть. При обработке информации внутри происходит сложный процесс. Но принцип обучения и последующего выполнения команды — одинаковый.

4. Нажмите по второй ссылке в последней строке — у неё будет формат [рандомные цифры и буквы].gradio.live. Это адрес, по которому временно размещён интерфейс нейросети, — ссылка откроется в новой вкладке. Вкладку с блокнотом не закрывайте в течение всей работы, иначе сессия прервётся и всё придётся начинать заново.

В основе сервера — пространства для генерации изображений. В «Дискорде» есть каналы Newcomer Rooms, внутри которых — сотни чатов Newbies. Именно в них создают картинки пользователи, которым нравится творить в большой компании. Выбирайте любой из чатов, в идеале — чтобы одновременно с вами там сидело не очень много людей. Вы будете видеть все их попытки создать картинку при помощи нейросети, а они — ваши.

Stable Diffusion — десктопная версия

Нейросетей для работы с визуалом много — особенно тех, что создают 2D-изображения. Они похожи по сути, но различаются в нюансах, достоинствах и недостатках: одни нейросети лучше понимают запросы, в других большой набор стилей, третьи предлагают много дополнительных инструментов для редактирования. Рекомендуем попробовать разные и выбрать те, что лучше всего подойдут лично вам.

По словам автора нейросети, Fooocus сочетает в себе лучшее от Stable Diffusion и Midjourney. От SD здесь открытый исходный код, бесплатная основа и автономность — то есть нейросеть работает не на удалённом сервере через интернет, а на компьютере пользователя. От Midjourney — отсутствие сложных ручных настроек.

Учитывайте весомость каждой части запроса. Те слова, которые идут вначале, сильнее влияют на результат, поэтому основной сюжет лучше указать сразу. Кроме того, можно добавлять «веса» к разным частям запроса через двойное двоеточие: corgi on a motorcycle as Marvel hero::5, cinematic shot::5, epic shot::2. Если пишете подробный запрос, это не требуется.

Как сохранить картинку. Можно скачать результат прямо из чата в «Дискорде». На компьютере пункт «Сохранить изображение» будет в меню при клике правой кнопкой мыши — как прямо в чате, так и если открыть в нем картинку отдельно. На смартфоне надо тапнуть на изображение, а когда оно откроется — на три точки в правом верхнем углу, там будет пункт «Сохранить».

ЧИТАТЬ ТАКЖЕ:  Что такое роевой интеллект в искусственном интеллекте

У каждой нейросети своя задача и свой алгоритм. К примеру, поиск Гугла по картинке — это тоже нейросеть. Вы показываете ей картинку и нажимаете кнопку «найти». Для нейросети это команда — «найди мне такую же или все, что на нее похоже». В память Гугла заранее загружена база картинок, сеть берет вашу и прогоняет ее по своей базе, сравнивая. И в итоге выдает вам все, что считает похожим. Как прогонять по базе и какие картинки считать похожими, нейросеть заранее научил человек.

—cref. Перенос персонажа: можно «переодеть» человека на картинке, поместить его в другую обстановку или создать последовательность сцен с сохранением облика героя. Работает в паре с параметром —cw, который определяет, насколько полно переносить образ. То есть к запросу добавляется конструкция: —cref (прямая ссылка на изображение человека) —cw (от 0 до 100).

5. В отдельной вкладке загрузится интерфейс нейросети — обычно это происходит за 1–2 минуты, но может потребовать чуть больше времени. Изначально интерфейс выглядит сдержанно — чтобы открыть больше настроек, поставьте галочку напротив Advanced.

Как устроен дискорд-сервер Midjourney. Главных каналов несколько: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах. Советую заодно ознакомиться с правилами в канале Rules, чтобы не возникало вопросов, если вас вдруг за что-то забанят.

Как работают нейросети и при чем тут нейроны

—no. Параметр, в котором можно прописать, чего на картинке быть не должно. Например, —no plants — рисовать сюжет без растений. Но важно учесть, что нежелательные предметы надо еще правильно назвать: хеллоуинская ведьма с параметром —no hat все еще будет в остроконечном колпаке. Потому что колпак называется witch’s hat — вот его-то и надо исключать.

Когда сформулируете запрос, нажмите кнопку «Отправить». Бот начнет генерировать изображение. Вы буквально в прямом эфире увидите, как смутные очертания превращаются в четыре картинки. Обычно генерация занимает не дольше минуты, но все зависит от нагрузки на сервер «Дискорда» и деталей конкретного запроса. Кстати, некоторые параметры заданы ботом изначально — например, скорость генерации. Посмотреть или изменить настройки можно, отправив команду /settings.

6. Справа появится четыре вкладки с расширенными настройками: там можно выбирать стили и модели, формат и соотношение сторон картинки, количество изображений по одному запросу и много других нюансов. Если поставить галочку напротив Enhance, откроется меню для редактирования и улучшения одного из сгенерированных вариантов. Input Image даёт возможность загружать картинки, на которые будет ориентироваться нейросеть.

Если генерируете в Midjourney v4 или v5 , запрос надо строить иначе. В старых версиях нейросеть учитывает описания меньшей длины и жестко ранжирует весомость слов: сначала надо сказать главное, потом через запятую добавлять детали. Например, corgi biker on a motorcycle , leather clothing, vintage motorcycle, sunset, photorealism. Начиная с Midjourney v6 лучше работают естественные описания, хотя старые промпты все еще могут давать хорошие результаты.

Стало: a confident corgi biker, dressed in a miniature leather jacket, custom-fit helmet with goggles, and a whimsical bandana, striking a pose on a classic Harley-Davidson motorcycle. The scene is set on an open road, cutting through a breathtaking landscape at sunset , with the warm glow of the setting sun illuminating the scene, creating long shadows and a sense of boundless freedom. The composition focuses on the corgi’s adventurous spirit, with a blurred background to emphasize the main subject.

Он получил доступ к информации, вышел в сеть и стал самым сильным интеллектом. А потом и вовсе обрел физическую оболочку. Так вот, самостоятельное обучение Альтрона — это художественный вымысел. Все современные нейросети обучает человек. И алгоритм их работы пишет он же.

Разница между мозгом человека и компьютерной нейросетью в том, что нейроны в мозге могут самостоятельно образовывать устойчивые связи, когда человек учится чему-то новому. А нейроны в компьютерной сети не умеют самостоятельно обучаться и формировать связи. Они умеют только получать, обрабатывать и выдавать информацию по команде.

—seed. Это числовой код, который присваивается каждой генерации. Его указывают в запросе, когда надо создать несколько картинок с разным сюжетом, но сходным визуальным стилем и композицией. Чтобы узнать seed, отреагируйте на картинку эмодзи с конвертом и посмотрите номер в личном сообщении, которое пришлет бот.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь