Нейросети

Как написать нейросеть генерирующую картинки

10.09.2024

Содержание статьи

1Топ-7 нейросетей для рисования: примеры картинок, плюсы и минусы
1.1RuDALL-E
1.2Как сформулировать запрос для нейросети?

Топ-7 нейросетей для рисования: примеры картинок, плюсы и минусы

RuDALL-E

В современной педагогике наряду с традиционными средствами обучения активно применяются информационно-коммуникационные технологии. Это касается и использования средств наглядности на уроках иностранного языка. Средства визуальной наглядности (фотографии, таблицы, схемы, рисунки, видеоролики и др.) – неотъемлемая часть современных учебников, а с развитием искусственного интеллекта появились новые возможности создания визуальных средств с помощью нейросетей.

Страх представителей творческих специальностей быть замененными ИИ в отдельных случаях оправдан, однако многие видят в современных технологиях возможность развития медиаиндустрии. Например, в июне прошлого года на обложке журнала Cosmopolitan появилась женщина-астронавт, которую сгенерировала нейросеть Dall-e 2. Тем же летом американский кинематографист Стив Коулсон представил хоррор-комикс «Summer Island», в котором самих героей, их костюмы и локации нарисовала нейросеть Midjourney. При этом на данном этапе нейросети пока не имеют профессиональных черт, присущих тем же дизайнерам или художникам, а потому могут быть лишь их полезным инструментом: в частности, создавать несложные логотипы, которые человек потом сможет сам отредактировать.

Images.ai – еще один бесплатный генератор изображений с возможностью делать запросы только на английском языке. Нейросеть предлагает большое множество стилистик таких, например, как ар-деко, импрессионизм, “дедушкина камера”, акварель, старая фотография, стиль Ван Гога и другие, что дает возможность широко экспериментировать с запросами.

Далее Fusion Brain предложит несколько инструментов для редактирования: различные стили, уменьшение или увеличение картинки, ластик, который позволяет убирать непонравившиеся объекты. Что касается последнего, то после того, как с помощью него будет стерта часть изображения, необходимо вновь ввести текстовый запрос для этой пустой части. В случае, если получившаяся картинка не устраивает, следует еще раз нажать «Создать». Загрузить работу можно с помощью соответствующей кнопки, которая находится в верхней левой части панели.

Современные технологии, в том числе искусственный интеллект (ИИ), постепенно начинают заменять многих специалистов. Закономерно, что и художники начнут «передавать» часть своих задач нейросетям, поскольку в сети появляется все больше программ, способных создавать картины по запросам. Здесь представлены бесплатные нейросети для генерации изображений по описанию или фото с пошаговой инструкцией, как создать картинку.

Для генерации изображений прежде всего необходимо четко и ясно сформулировать свой запрос. Не всегда оказывается достаточным написать сам фразеологизм в форме запроса, тем более, что не все нейросети хорошо понимают запросы, сделанные на русском языке. Например, “волк в овечьей шкуре” (“wolf in sheep’s clothing”) является понятным запросом для нейросети, и несколько достойных изображений можно получить уже при первой генерации. Уточню, что далее в статье запросы делались на английском языке для получения лучшего результата, только для Midjourney v5 и Кandinsky2 были сделаны на русском языке.

Как сформулировать запрос для нейросети?

Изображения в современных учебниках и изображения, сгенерированные нейросетью, могут иметь схожие недостатки при применении в учебном процессе: например, быть недостаточно информативными, не подходить для целей обучения, неправильно интерпретироваться и даже затруднять понимание материала. Для преодоления этих трудностей у преподавателя или методиста должно быть четкое понимание целей использования визуальных средств и знание критериев их отбора.

ЧИТАТЬ ТАКЖЕ: Что делает нейросеть

Начнем с того, что не во всех учебниках по РКИ представлены современные, яркие, привлекающие внимание изображения. Проанализировав изображения, встречающиеся в современных учебниках, к их недостаткам я отношу: минимальное использование цветных изображений или только черно-белые иллюстрации, сугубо декоративный характер некоторых изображений, дублирование информации из диалогов или текстов без углубления понимания, использование однотипных серийных фотографий из фотобанков и стоков, низкое качество изображений. Большинство этих недостатков связаны с ограниченным бюджетом печатных изданий.

Понимание прямого значения слов-компонентов фразеологизма может значительно помочь в овладении значением переносным. С этой целью может применяться визуализация: изображение помогает учащимся “увидеть» ситуацию, понять связь между прямым значением слов-компонентов и общим смыслом фразеологизма, сформировать необходимые для запоминания ассоциации, помочь лучше понять связь фразеологизма с конкретной культурой и ее ценностями.

Например, трудности в генерации возникают при вводе запроса “медвежья услуга”. Фразеологизм “медвежья услуга” пришел в русский язык благодаря переводной басне И. А. Крылова (оригинал “Пустынник и медведь” Жана де Лафонтена). Этот фразеологизм также присутствует в других языках.

При этом для того, чтобы создать картинку с помощью нейросети, системе приходится анализировать миллионы изображений, загруженных в ее базу. Как правило, они берутся из интернета и сопровождаются соответствующими подписями. Нейросеть объединяет знания обо всех объектах и в дальнейшем находит нужные фрагменты по ключевым словам в запросе. Например, изучив тысячи фотографий с лемурами, в дальнейшем она сможет создать точное изображение животного, уже зная, в какой позе и где он чаще всего сидит.

Для того чтобы пользоваться нейросетью, необходимо установить платформу Discord и зарегистрироваться на ней. Количество бесплатных попыток в этой сети, к сожалению, ограничено — их всего 25. Поэтому, несмотря на качественные, впечатляющие изображения, бесплатно пользоваться этой нейросетью на постоянной основе не получится.

Kandinsky2.1 – российская нейросеть, которую можно использовать для генерации качественных изображений на основе текстового запроса и/или изображения, а также смешивая картинки между собой. Большим плюсом является возможность писать запросы на русском языке, без перевода на английский.

Еще одной нейросетью, которую можно использовать для бесплатной генерации изображений, является ClipDrop Stable Diffusion XL. Возможности этой нейросети позволяют выбирать параметры изображения и генерировать их необходимое количество, обрабатывать и даже извлекать изображения из физического окружения в цифровое пространство. Иллюстрации здесь, на мой взгляд, не настолько красочные и детальные, как у предыдущих нейросетей, но зато есть возможность упражняться в запросах неограниченное количество раз.

Топ-7 нейросетей для рисования: примеры картинок, плюсы и минусы

RuDALL-E

Как сформулировать запрос для нейросети?

ОСТАВЬТЕ ОТВЕТ Отменить ответ

ЭТО ПОПУЛЯРНО

ЭТО ИНТЕРЕСНО

ВЫБОР РЕДАКТОРА