Содержание статьи
Лучшие нейросети для генерации изображений
Как пользоваться Midjourney
DALL-E 3 появилась в сентябре 2023 года. Эта версия понимает значительно больше нюансов и деталей, чем нейросети предыдущего поколения, и позволяет легко воплощать идеи в исключительно точные изображения. Современные системы преобразования text-to-img имеют тенденцию игнорировать определенные слова в промте. Так что пользователю волей неволей приходится изучать prompt engineering — и здесь DALL-E 3 представляет собой подлинный скачок. Смотрите сами, DALL-E 2 (слева) и DALL-E 3 (справа): DALL-E 3 построен на базе ChatGPT, так что вы можете использовать его для уточнения промтов. Просто спросите ChatGPT, что вы хотите увидеть — от краткого предложения до подробного абзаца. Результат будет хорошим. Если у вас есть промт, ChatGPT автоматически сгенерирует индивидуальные, подробные подсказки для DALL-E 3, которые и воплотят вашу идею в жизнь. Если же вам понравился какой-то стиль, но он не совсем подходит для конкретного визуала, — попросите ChatGPT внести коррективы. Как и в случае с DALL-E 2, изображения, созданные с помощью DALL-E 3, принадлежат вам, и вам не нужно наше разрешение на их перепечатку, продажу или продажу. Стоит отметить, что DALL-E 1, 2 и 3 — это одна и та же нейросеть (первая версия превратилась в DALL-E 3 — она приобрела новый функционал и стала более точной и быстрой).
Ползунки тоже работают не совсем привычным образом — это больше похоже на смешение трех основных цветов для получения новых, чем выбор из готовой палитры цветов. Например, если вы хотите у персонажа на вашем портрете сменить расу на азиатскую, недостаточно просто увеличить соответствующий параметр — нужно соответственно уменьшать или увеличивать ползунки и других рас, чтобы прийти к удовлетворяющему результату.
Важно: установщик работает только с видеокартами Nvidia 10XX (во всяком случае, на момент написания этой статьи). Вам нужно хотя бы 4 гб видеопамяти и 16 гб оперативной памяти. Все вместе на вашем компьютере займет не менее 11 гб дискового пространства.
5. После вылезет запрос на доступ к вашему гугл-диску — его нужно разрешить, чтобы картинка сгенерировалась. Начнется процесс — в зависимости от настроек придется подождать от 10 минут до нескольких часов. Рисунок появится и на странице сети после завершения, и на вашем гугл-диске.
2. Следом вам нужен Python — скачать его можно тут. Обычно советуют выбирать версию 3.10.6 — с ней уже точно известно, что нейросеть запускается. Обязательно поставьте галочку на Add Python to path, чтоб нейронка запустилась по итогу и развернула сайт.
2. В новом окне сверху у вас будет функция Add parent — она позволяет добавлять дополнительные изображения, на которые будет опираться нейросеть. Это необязательно, можно ограничиться одним и править его. Ограничений по количеству родительских артов мы не обнаружили.
Минусы:
Не получится с людьми.
Изображения чаще всего напоминают полуабстрактное искусство, чем конкретный запрос. Это все еще может быть интересно, но если вы хотите нечто совсем конкретное, особенно связанное с людьми, поверх надо будет дорисовывать самостоятельно.
Разрешение у картинок не очень высокое.
Нельзя настроить ничего, кроме стиля.
Не создает варианты, а предлагает только одну картинку.
Если вы хотите получить именно арт, очень важно уточнить это в запросе, иначе нейросеть вам выдаст фотографию. Вы можете указать как жанр (например, ар-нуво), так и стиль конкретного художника (допустим, «рисунок в стиле Ван Гога» или «детальный цифровой арт в стиле Руан Джиа»). Последним советуем пользоваться, если вы хотите получить результат, похожий на современные цифровые работы.
1. В поле с текстовым описанием вбейте свой запрос, а в квадрате нарисуйте под этот запрос коллаж. Вы можете нарисовать его простыми формами, а можете найти во встроенном поиске нужные вам объекты — для этого на панели слева надо нажать на четвертый значок в столбике с картинкой, под ножницами.
Steps, шаги — это количество промежуточных картинок, которые будут использованы для создания рисунка. Чем больше шагов — тем более детальная иллюстрация получится, однако тем больше времени она потратит и больше места на вашем диске займёт. Обычно достаточно 150-300 шагов, выше 500 лучше не подниматься.
Wight_height, высота_ширина — это разрешение самой картинки, ее размер. Первой идет ширина, следом — высота.
Нейросеть от некоммерческого проекта OpenAI в первой своей версии не произвела особого впечатления. DALL-E посредственно справлялась с задачами по генерации изображений и редактированию существующих, поэтому появившиеся позже проекты быстро ее затмили. Фурор произвела нейросеть DALL-E 2, которая была показана в апреле 2022 года. Доступ к ней до сих пор получили немногие, но те, у кого он есть, — в восторге. Эта нейросеть позволяет создавать уникальные детализированные и точные картины в любом стиле, а также редактировать существующие изображения, добавляя на них новые объекты или, наоборот, убирая их.
Одна из самых популярных нейросетей, но уже куда более требовательная. Придется повозиться с установкой + вам нужен относительно мощный компьютер, чтобы потянуть сетку: для нормальной работы у вас должна быть видеокарта с хотя бы 4-6 гб видеопамяти и 16 гб оперативной памяти.
Простая в использовании и эффектная нейросеть на базе Stable Diffusion. Генерирует картинки по текстовому запросу. Она условно-бесплатная: за каждый запрос снимается от 5 до 10 кредитов в зависимости от настроек. На старте даётся сразу 100 кредитов, раз в час начисляется по 1 кредиту, если вы были онлайн последние 48 часов. Максимум на счету может быть ~100 кредитов в бесплатном аккаунте. Если хотите больше кредитов и отсутствие лимитов, нужно платить — $15 минимум.
5. Теперь в стартовой папке со Stable Diffusion найдите в файлах webui-user.bat и запустите его. Откроется консоль — и теперь вам нужно подождать около 5-15 минут (иногда дольше). В консоли важны строки Model Loaded и Running on Local URL. У последней фразы после двоеточия будет указан локальный URL-адрес вида «http://000.0.0.0:0000» (у вас будут другие цифры) — на него вам нужно перейти, не выключая консоль. В итоге у вас откроется страничка со всеми нужными окошками и настройками для генерации картинок.