Почему нейросети плохо рисуют руки

0
11

Нейросеть Midjourney научилась правильно рисовать пальцы на руках: посмотрите, как реалистично выглядят люди на фотографиях

Как проверить работу новой версии Midjourney?

Дело в том, что ИИ не осмысливает референсы с точки зрения анатомии и восприятия человека. Кроме того, на многих исходниках кисти рук показаны с разных ракурсов, так что видно разное количество пальцев — а когда предметов много, но неясного количества, машина выдаёт случайный результат.

Сетевое издание Men Today
Учредитель ООО «Фэшн Пресс»: 119435, г. Москва, Большой Саввинский пер., д. 12, стр. 6, этаж 3, пом. II;
Адрес редакции: 119435, г. Москва, Большой Саввинский пер., д. 12, стр. 6, этаж 3, пом. II;
Главный редактор: Антон Леонидович Иванов
Адрес электронной почты редакции: info@mentoday.ru
Номер телефона редакции: +7 (495) 252-09-99
Знак информационной продукции: 16+
Cетевое издание зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-84122 от 09 ноября 2022 г.

Безумные рукиГлавная причина, по которой пользователи критикуют нейросети, — это неумение рисовать руки. ИИ не усваивает форму человеческой кисти и добавляет лишние пальцы или, наоборот, рисует «лапки динозавра», а также в целом искажает конечности. Иногда нейросети даже дорисовывают лишнюю руку или ногу целиком. Причём стиль рисовки здесь не имеет значения: безумные руки можно увидеть и у реалистичных изображений, и у «мультяшных».

© 2021 — 2024 ООО «Фэшн Пресс»
При размещении материалов на Сайте Пользователь безвозмездно предоставляет ООО «Фэшн Пресс» неисключительные права на использование, воспроизведение, распространение, создание производных произведений, а также на демонстрацию материалов и доведение их до всеобщего сведения.

Обрезанные головы и перекошенные лицаБывает и такое, что нейросеть генерирует арт с человеком с урезанной головой или вовсе без неё. Дело в том, что при загрузке референсов люди добавляют картинки не во весь рост или такие, где туловище занимает большую часть пространства — нейросеть путается и начинает считать именно торс самой важной частью потрета, позволяя себе обрезать голову.

Бум нейросетей — тренд последних лет, который набрал обороты в конце 2022 года. Искусственный интеллект (ИИ) стал доступен широкому кругу пользователей как возможность генерировать уникальные изображения и иллюстрировать самые безумные фантазии, так что в интернете уже поговаривают о том, что профессия дизайнера изжила себя, ведь технология уже рисует лучше и быстрее. При этом есть несколько проблем, которые создателям нейросетей ещё не удалось решить до конца — Sostav рассказал о них в своём материале.

ЧИТАТЬ ТАКЖЕ:  Миджорни нейросеть как обработать фото

Почему у нейросетей плохо получается рисовать кисти рук?

Лишние зубы, языки и челюстиПорой нейросеть рисует зубы и другие детали рта не лучше рук: рот во рту, челюсть на челюсти, кривые зубы или безумное их количество. Как и в случае с конечностями, ИИ понятия не имеет, как изобразить много похожих объектов в рамках одного, и почему конечный результат не выглядит натурально.

Также «дипфейковые» глаза движутся неестественно быстро — это отметил журналист The Verge, протестировавший новую функцию. На части видео он смотрит в камеру, так что зритель может увидеть разницу между тем, как это выглядит при обычной съёмке и после обработки ИИ. Кроме того, наличие и отсутствие очков никак не сказалось на качестве изображения.

Размытые детали, пятна и линииБывает такое: арт от нейросети кажется красивым и детализированным, но если начать присматриваться, то оказывается, что никакие конкретные детали там не прорисованы. Эта проблема встречается чаще, чем может показаться: вместо цветов — пятна, вместо птиц — пятна, вместо надписей — линии и пятна. Формы напоминают то, что должно быть изображено, но ничего в сущности разглядеть на таких картинках нельзя.

«Что-то с глазами»Эту проблему продемонстрировали многочисленные эксперименты с нейросетью Lensa, в которой пользователи делали для себя аватарки в различных стилях по фото. Многие жаловались на косые глаза и странный взгляд на изображениях. Причём отбраковывать такие картинки было особенно обидно — в остальном многие из них выходили красивыми и яркими.

Проблема сохраняется и тогда, когда ИИ призван решить проблему зрительного контакта человека с камерой. Недавно компания Nvidia выпустила технологию на основе нейросети, которая позволяет создать имитацию зрительного контакта на видео, если человек не смотрит в камеру. Выглядит это так, как будто ИИ просто поменял расположение глаз — взгляд такой же неживой и расфокусированный, как на многих картинках от нейросетей.

ИИ неплохо научились рисовать лица и одежду людей, а вот с пальцами рук у многих нейросетей-генераторов до сих пор были проблемы. Дело в том, что на фотографиях в датасетах руки встречаются довольно редко. Также при генерации таких картинок приходится учитывать многие нюансы: на исходных изображениях могут быть видны только отдельные части пальцев или кисти.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь