Содержание статьи
10 самых популярных нейросетей для создания картинок
RuDALL-E
Нейросети научились создавать впечатляющие иллюстрации, имитировать картины известных мастеров и фотореалистичную графику. Изображения можно добавлять в презентации, посты в соцсетях или использовать для вдохновения. Выгоревшие дизайнеры, иллюстраторы и SMM-специалисты оценят этот инструмент.
ruDALL-E — русская версия нейросети DALL-E от Сбера. DALL-E — одна из версий модели GPT-3, обученная генерировать изображения из текста. Первый компонент нейросети (CLIP) переводит текст в цифровую среду и создает набросок изображения. CLIP тренировали на датасете из 600 миллионов картинок с подписями. Второй компонент GLIDE детализирует изображение. На финальном этапе алгоритм доводит картинку до максимально возможного уровня качества. DALL-E активно используют в коммерческих целях. Например, журнал Cosmopolitan поместил на обложку изображение, сгенерированное нейросетью.
Это чат-бот от компании Open AI, разработанный на базе языковой модели GPT-3,5. Нейросеть может вести диалог, рассказывать анекдоты и писать тексты. Модель прошла обучение с подкреплением, получала фидбэк от людей и совершенствовала свои алгоритмы. Этот чат-бот можно использовать вместо поиска, для написания простого кода и поточных текстов, например, карточек товаров для интернет-магазина.
Важно учитывать, что пользователи из РФ могут столкнуться с проблемой при оплате сервисов, потому что требуется карта иностранного банка. Выходом может быть совмещение в работе профессиональных инструментов с ограниченной подпиской и полностью бесплатных нейросетей.
Автор книги «Before the Brand: Creating the Unique DNA of an Enduring Brand Identity» Алисия Перри подсчитала, что 98% английского словаря состоит из названий брендов. Придумать оригинальное название для бизнеса, которое понравится пользователям, непросто. А после этого еще нужно выбрать цвета, логотип и придумать фирменный стиль. Принять решения и поставить задачу дизайнерам предпринимателю поможет искусственный интеллект.
Картинки получаются контрастными, в хорошем качестве, без проблем с анатомией, но не очень реалистичные, даже с указанием photoreal. Если не требуется сильная реалистичность, Lexica отлично подойдёт для создания иллюстраций, которые можно использовать в дизайне баннеров, обложек, рекламных плакатов.
В Craiyon нет лимита на количество генерируемых изображений. Нейросеть создаёт девять вариантов по одному запросу, но не всегда следует промпту. По промпту «женщина в деревне, похожая на Джулианну Мур, в стиле Skyrim» нейросеть сгенерировала три иллюстрации вообще без героини.
Нейросети умеют рисовать реалистичные портреты и фантастические арты в любом стиле: от комикса до картин Ван Гога. Благодаря этому они упрощают работу многим специалистам. Особенно дизайнерам, SMM-специалистам и маркетологам. Ведь готовые изображения можно использовать для оформления статей, публикаций в соцсетях, рекламных баннеров.
Преодолеть «страх чистого листа»
Artbreeder подойдёт пользователям, которые хотят сделать необычный арт из своих фотографий. Но для профессиональных дизайнеров возможностей нейросети может быть недостаточно, потому что изображения получаются не очень чёткими и реалистичными, фон сильно размыт.
Нейросеть Dream by Wombo можно использовать бесплатно. Для создания изображений нужно зарегистрироваться или войти в аккаунт Google. Интерфейс не вызывает сложностей, нужно ввести текстовый запрос на английском языке, выбрать один из 57 бесплатных стилей и нажать кнопку.
В Dream by Wombo нет ограничений для генерации картинок, но по одному запросу создаётся только один вариант. В протестированном стиле Deamland v3 получили разные варианты: Одри Хепбёрн довольно реалистичная, Малефисента и Джулианна Мур — в виде иллюстраций.
Инструмент создал разработчик из Google Дэн Мотценбекер на проекте AI Experiments от Google Creative Lab. Нейросеть работает на базе платформы Google Cloud Vision API и переводчика Translate API. Эти технологии позволяют с высокой точностью распознавать объекты на картинках и выдавать машинный перевод. Нейросеть считывает форму предмета, ищет совпадения, распознаеёт вещь и переводит название на выбранный язык. Сервис знает немецкий, французский, испанский, итальянский, китайский, японский, корейский, датский языки и хинди. Иногда инструмент ошибается, но, как и любая технология машинного обучения, учится на своих ошибках и совершенствуется с каждым запросом.
Нейросети пока не могут написать большой и связный текст без помощи человека. Тем не менее они помогут начать статью или рассылку, сформулировать мысль или идею. Сервисы могут быть полезны для копирайтеров, менеджеров и всех, кому приходится или хочется писать.
Artbreeder предлагает несколько инструментов для генерирования: объединение картинок, дорисовка изображений, создание артов по текстовому запросу и фото. Кроме того, можно использовать ползунок, чтобы показать нейросети, насколько новое изображение должно быть похоже на предыдущее или соответствовать промпту.
Для профессионального использования лучше подходят Lexica, Starryai, Easy-Peasy.AI, потому что умеют создавать детализированные и сложные арты с разрешением до 4–8К. Начинающие дизайнеры и SMM-специалисты могут попробовать бесплатные нейросети для создания картинок — Bing Image Creator, Dream by Wombo, Artbreeder, Kandinsky 2.2, Шедеврум, в которых получаются красивые арты в разрешении, достаточном для публикации в социальных сетях.
Stable Diffusion — инструмент от группы Stability.Ai. Нейросеть создает картинку по словесному описанию. Она использует в работе кодировщик текста, который описывает каждое слово с помощью списка чисел или вектора. Генератор изображения обрабатывает эти данные и преобразует в пиксельную картинку. Нейросеть уже используют для создания контента — в телеграм-канале АктаНейро можно посмотреть, как Stable Diffusion генерирует изображения к новостям.