Содержание статьи
Как составлять промпты к нейросетям для создания картинок
Промты для Midjourney
«I want you to act as an English translator, spelling corrector and improver. I will speak to you in any language, and you will determine the language, translate it and respond with a corrected and improved version of my text in English. I want you to replace my simplified A0 level words and sentences with more beautiful and elegant top-level English words and sentences. Keep the meaning, but make them more literary. I want you to respond only to corrections and improvements, and nothing else, do not write explanations. My first suggestion: «Я бы хотел пригласить вас на ужин». Вместо фразы «Я бы хотел пригласить вас на ужин» подставьте свой текст, который нужно перевести.
Midjourney пользуются не только дизайнеры и художники. Этот инструмент пригодится всем, кому нужны уникальные изображения. Нейросеть нарисует картинки для статьи в блог, поста в социальной сети, книги, рекламного баннера, компьютерной игры или любого другого проекта. Ниже мы рассмотрим несколько промтов, которые помогут создать разноплановые иллюстрации. Вы можете использовать их в том же виде либо доработать на свое усмотрение.
«beautiful open kitchen in the style of elena of avalor overlooking aerial wide angle view of a solarpunk vibrant city with greenery, interior architecture, kitchen, eating space, rendered in octane, in the style of Luc Schuiten, craig mullins, solarpunk in deviantart, photorealistic, highly detailed, Vincent Callebaut, elena of avalor, highly detailed, –ar 16:9».
Промптеры — небольшие сервисы, помогающие сформулировать запрос. Работают они примерно одинаково: пользователь сам составляет базовое описание, что должна нарисовать нейросеть, а дополнительные параметры выбирает уже из готового списка. Попробуйте Promptomania или PromptHero.
Стилизация. Чем ниже значение, тем точнее результат соответствует запросу, но тем менее художественным он будет. Значение по умолчанию — 100, можно указать любое другое целое число в диапазоне от 0 до 1000. Чтобы воспользоваться параметром, нужно добавить —stylize или —s к запросу.
В соцсетях говорят, что скоро появится новая профессия — человека, который составляет запросы к нейросетям, промпт-инженера. Такая должность может понадобиться, ведь чтобы разобраться в тонкостях составления запросов для Midjourney, Stable Diffusion или Dall-E 3 , нужно потратить время. Да и немногие хотят тратить часы на генерацию сотни картинок, чтобы получить одну желаемую.
Нейросети обучают на огромной базе изображений из сети. Картинок такого типа в интернете много, поэтому нейросети легко их сгенерируют. Правда, если вписывать в команду исключительно один объект, то результаты вряд ли порадуют разнообразием. Поэтому попробуйте, например, совместить два объекта и получить необычный концепт: кот-геймер , некромант-капиталист, киберпанк-монах.
В то же время не стоит увлекаться и пытаться генерировать концепции, которые предполагают обдумывание и самостоятельные выводы. Этим вы только запутаете нейросеть. Если есть возможность — выбирайте конкретные запросы, где абстрактные понятия заменяют объекты. Вместо «оптимистичного будущего» попробуйте «киберпанк-город с голограммами», а вместо «моды в 2222 году» — «футуристичную одежду со светящимися и красочными украшениями».
🖼️ Учимся использовать картинки
Синонимы. Не бойтесь повторяться в запросах — так нейросеть попытается понять, к чему вы больше всего стремитесь. Например, если вы хотите передать мрачное настроение, то одновременно используйте слова «темно», «мрачно», «плохо освещено», «страшно», «хоррор». Это часто «раздувает» промпты: встречаются варианты на четыре-пять строк с постоянно повторяющимися запросами.
В нейросеть можно загрузить статью и попросить у нее написать саммари длиной в 500 символов. Это особенно полезно, если вспомнить, что модели естественного языка GPT-3 и GPT-4 используют информацию до 2021 года. То есть, о новейших научных изысканиях они просто не знают. Но узнают, если им об этом рассказать.
Действия. Сформулируйте действие так, чтобы его можно было наглядно отразить на картинке. Глаголы «стоит» или «идет» помогают гораздо больше, чем «мечтает» или «беспокоится». Если вам все же нужно изображение с неочевидным действием, то добавьте детали: не просто «размышляет», а «сидит, погруженный в мысли».
В бесплатном демо-режиме Midjourney обрабатывает до 25 запросов (каждая доработка одного и того же изображения считается как отдельный запрос). 200 запросов в месяц стоят $10. За $30/месяц можно приобрести тарифный план, в котором доступны 15 GPU-часов (время, которое нейросеть тратит на обработку промта), в течение которых вы можете создать сколько угодно картинок. На данный момент с российских карт оплата не проходит, поэтому придется искать обходные пути.
Нейросети постепенно становятся привычным инструментом для выполнения рабочих и творческих задач . Они умеют писать тексты и код, рисовать картинки, обрабатывать фотографии и видео, создавать аватары, отвечать на вопросы. Однако на пути к их эффективному применению стоит вопрос — как правильно составить промт, чтобы получить нужный результат, а не бессмыслицу? Об этом мы расскажем в сегодняшней статье: разберем, что такое промты и как их создавать, а также дадим готовые запросы для нейросетей ChatGPT, Midiourney и Stable Diffusion.
«underwater, squirrel, oh no! bubbles, gods rays, alberto seveso art, cubism, colourful, water ink, ink water, ink cloud, alberto seveso art, loose painting style, intricate detail, cinematic lighting, octane render, 8k render, volumetric lighting, trending on artstation, sharp focus, studio photo, intricate details, highly detailed, by greg rutkowski, plain white background».
Используйте контекст
Seed. Стартовая точка, из которой нейросеть затем формирует изображение. По умолчанию стоит «случайный» параметр — это помогает достигать разных результатов при одном и том же запросе. А если вы используете конкретное номерное значение сида, то потом даже при смене запроса композиция картинки останется схожей. Всего сидов около 16 миллиардов, конкретными сидами можно делиться с остальными, чтобы генерировать похожие картинки.
Основная ошибка тех, кто разочаровался в работе нейронной сети — это неумелое составление промтов. Не стоит полагаться на то, что система поймет вас с полуслова. Ставя задачу «Нарисуй пейзаж», будьте готовы получить любую картинку, от грибной поляны после дождя до зимнего леса. А вот если вы конкретизируете запрос «Нарисуй летний пейзаж, на картинке спокойное озеро, лодка, деревья и первые лучи заката», то шансы получить нужный результат возрастут многократно.
Программа бесплатная, но можно подключить версию ChatGPT Plus за $20/месяц. Обладатели подписки получают доступ к API и дополнительным возможностям (например, могут пользоваться чатом на мобильных устройствах). Их запросы нейросеть обрабатывает в приоритетном порядке и выдает более качественный текст.
Если изображение все равно выглядит плохо или не соответствует задумке, добавляйте или убирайте слова и фразы. Опытным путем попытайтесь понять, почему ИИ делает такой выбор, какой получается на изображении. Всегда присутствует логика того, почему объекты расположены на картинке именно так, хотя она может быть непостижимой для человека.
Такой подход отлично работает, когда нужно писать скрипты, ответы на вопросы, описания к фотографиям и короткие посты в определенном стиле. Еще он работает не только с написанием текстов, но и, например, с программированием. И другими вещами, с которыми машина точно справится быстрее человека.
Однако некоторые нейросети, например Dall-E 3 , отказываются генерировать известных героев, защищенных авторским правом. В таком случае попробуйте описать персонажа словами, не называя его по имени: не Гарри Поттер, а мальчик-волшебник с темными волосами, в очках и со шрамом-молнией.