Как научить нейросеть рисовать

0
20

Нейросети для рисования: 12 лучших сервисов для генерации изображений

Юлия Плаксина

По каждому запросу получается четыре варианта картинки. Стиль, качество, степень детализации и фотореалистичность зависят от запроса. Модель Lexica Aperture позволяет получать очень качественные арты, но надо потренироваться писать для нее промпты — как и для Stable Diffusion, на которой она основана.

Как им стать? Самостоятельно сделать это почти невозможно. Это серьезная специализация, которая требует взаимодействия с теми, кто уже работает в данной области. Поэтому школа данных SkillFactory открывает новый набор на полный курс по Data Science. В рамках курса профессионалы отрасли, в том числе сотрудники Яндекса и NVIDIA, обучают тонкостям работы, о которых не пишут в учебниках.

Из недостатков — работает только через мобильные приложения и создает только квадратные изображения. Да и в целом возможностей работы с картинками, кроме собственно генерации, почти нет. Впрочем, для некоторых задач этого достаточно — например, если вы создаете иллюстрации к постам в соцсети.

Все началось с попыток ученых приблизить принцип работы компьютера к образу мышления человека. На это ушли десятилетия исследований, и в итоге это стало возможным при помощи нейросетей — компьютерных систем, собранных из сотен, тысяч или миллионов искусственных клеток мозга, которые способны обучаться и действовать по принципу, чрезвычайно похожему на то, как работает мозг человека.

Главным трендом последних нескольких лет, безусловно, можно назвать нейросети, машинное обучение и все, что с ними связано. И на то есть серьезные причины, ведь в последнее время нейронные сети удивляют своими умениями. Мало того, что нейросеть уже может нарисовать портреты людей по одним только их голосам и «оживлять» портреты Достоевского и Мэрилин Монро, так она еще способна показать, как вы будете выглядеть через 20, 30 и даже 50 лет! Конечно, все это делает не одна нейросеть — в мире существует множество подобных разработок, которыми занимаются специалисты по Data Science.

В актуальной версии «Шедеврума» картинки получаются без лишних артефактов, детализированными и разнообразными. Фотореалистичность, как правило, уступает Midjourney, но в других стилях арты получаются очень качественными. «Шедеврум» хорошо понимает запросы на русском и полностью бесплатен.

В сервисе есть собственный набор ИИ-инструментов , чтобы увеличить разрешение картинки, убрать фон или заменить его на хромакей, сделать черно-белое фото цветным или удалить с него какие-то объекты. Все это работает и со сгенерированными здесь же изображениями, и с загруженными пользователем. Причем часть инструментов не расходует кредиты.

Другой вариант — запустить нейросеть через Google Colab, сервис для использования чужих вычислительных мощностей. Проблема с этим вариантом в том, что Google часто блокирует колабы со Stable Diffusion, считая нейросеть нецелевым использованием сервиса. Тем не менее колабы от некоторых сервисов, например Fooocus, еще работают.

Starryai

Bing Image Creator — самый простой способ попробовать нейросеть Dall-E от OpenAI. Microsoft внедряет нейросетевых помощников во все свои сервисы, от поиска до ассистента Copilot в Windows 11 и кнопки для генерации картинок Cocreator в Paint. Для их использования нужен аккаунт Microsoft, а в России — еще и VPN.

Где попробовать: в чате с ChatGPT (сайт недоступен из РФ)
Простота освоения: 🤖🤖🤖🤖
Качество генерации: 👨‍🎨👨‍🎨👨‍🎨👨‍🎨👨‍🎨
Фан-эффект: 😎😎😎😎😎
Язык: русский, английский и десятки других
Стоимость: от 20 $⁣ ( 1800 ₽) в месяц

В процессе обучения вы сможете создавать свои проекты в сфере распознавания изображений, NLP и скоринга. Вместе с преподавателями и менторами разберетесь в деталях работы и получите необходимую обратную связь. Кроме того, в SkillFactory помогают с трудоустройством и рекомендуют к стажировке в крупных компаниях. Например, выпускники получают возможность работать в «Альфа-Банке», Bayer, Henkel, «Сбербанке» и других ведущих организациях.

ЧИТАТЬ ТАКЖЕ:  Как с помощью нейросети сделать песню другим голосом

Lexica — буквально библиотека, в которой хранятся миллионы изображений, созданных нейросетью Stable Diffusion и собственной моделью сервиса — Lexica Aperture. Можно нажать на любую работу и увидеть использованный при ее создании промт и выбранную модель. Это хорошая возможность вдохновиться и усовершенствовать собственные запросы для нейросетей. Или не создавать свои картинки, а найти похожие в базе.

Midjourney генерирует картинки с любым соотношением сторон, перерисовывает отдельный участок понравившегося арта, добавляет участки слева, справа, сверху и снизу. Через команды в запросе можно задать, насколько точно нейросети нужно следовать промпту или, напротив, проявлять фантазию. Команда /describe позволяет загрузить любую картинку и попросить сервис составить запросы, по которым он нарисовал бы что-то подобное.

Для многих основной барьер при работе с нейросетями — знание английского языка для текстовых описаний. Нейросеть от Сбера решает эти проблемы: она хорошо понимает русскоязычные команды. Если предыдущие версии Kandinsky уже сильно устарели, то новая приближается по уровню генерации и стилистике к Midjourney v5 — это отличный уровень.

Stable Diffusion

Midjourney генерирует красивые картинки и по простым запросам, но по-настоящему раскрывается при углублении. С нейросетью можно создавать арты, реалистичные фотографии, кадры из фильмов, воссоздавать известных людей. Сервис стали так много использовать, что бесплатный пробный доступ отключили.

Конечно, нельзя говорить, что нейронная сеть — это точная искусственная копия мозга. Важно отметить, что нейросеть — это прежде всего компьютерная симуляция: такие сети созданы посредством программирования обычных компьютеров, в которых традиционным образом работают обычные транзисторы, объединенные в логические связи.

Нейросеть создает арты на основе текстового описания, но с дополнениями. При создании картинки обязательно нужно выбрать, что это будет: рисунок, фото, что-то на основе вашей собственной модели. Дальше стиль можно уточнить, выбрав одну из предобученных моделей, а можно оставить этот параметр выбранным по умолчанию. От выбора будет зависеть фотореалистичность результата.

Когда сеть обучается, образцы информации «скармливают» ей через блоки ввода, а затем добираются до блоков вывода. Например, можно показать нейросети огромное количество фотографий стульев и столов, максимально доступно объяснив ей разницу между этими предметами мебели. А затем попросить ее распознать объект на картинке, где изображен шкаф. В зависимости от того, насколько эффективно вы обучили нейросеть, она попытается отнести увиденное к категории, основываясь на имеющемся опыте.

С помощью этого курса можно освоить науку по работе с данными с нуля, даже если вы ни разу в жизни не занимались программированием. Он позволяет получить все навыки, необходимые специалисту по Data Science — от программирования на Python, в том числе углубленного изучения Pandas для анализа данных, до машинного обучения, глубинного обучения и исследования данных. Курс состоит примерно из 20% теории и 80% практики, поскольку только на реальных примерах возможность стать профи в этой области.

Другая особенность Krea — работа с готовым изображением. Сервис предлагает добавить на сгенерированную работу картинку из ваших файлов, геометрические фигуры, нарисовать что-то , как в Paint, доработать детали и многое другое. Это делает Krea не только генеративной нейросетью, но и удобным фоторедактором.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь