Безумные руки и «стеклянные» глаза: что до сих пор плохо рисуют нейросети
Безумные рукиГлавная причина, по которой пользователи критикуют нейросети, — это неумение рисовать руки. ИИ не усваивает форму человеческой кисти и добавляет лишние пальцы или, наоборот, рисует «лапки динозавра», а также в целом искажает конечности. Иногда нейросети даже дорисовывают лишнюю руку или ногу целиком. Причём стиль рисовки здесь не имеет значения: безумные руки можно увидеть и у реалистичных изображений, и у «мультяшных».
Проблема сохраняется и тогда, когда ИИ призван решить проблему зрительного контакта человека с камерой. Недавно компания Nvidia выпустила технологию на основе нейросети, которая позволяет создать имитацию зрительного контакта на видео, если человек не смотрит в камеру. Выглядит это так, как будто ИИ просто поменял расположение глаз — взгляд такой же неживой и расфокусированный, как на многих картинках от нейросетей.
Дело в том, что ИИ не осмысливает референсы с точки зрения анатомии и восприятия человека. Кроме того, на многих исходниках кисти рук показаны с разных ракурсов, так что видно разное количество пальцев — а когда предметов много, но неясного количества, машина выдаёт случайный результат.
Технология ещё учится, и многие работы уже сейчас корректнее изображают человека и реальные предметы. Есть ли в будущем место человеческим дизайнерам — это открытый вопрос, на который можно будет ответить только спустя годы, наблюдая за развитием искусственного интеллекта.
Бум нейросетей — тренд последних лет, который набрал обороты в конце 2022 года. Искусственный интеллект (ИИ) стал доступен широкому кругу пользователей как возможность генерировать уникальные изображения и иллюстрировать самые безумные фантазии, так что в интернете уже поговаривают о том, что профессия дизайнера изжила себя, ведь технология уже рисует лучше и быстрее. При этом есть несколько проблем, которые создателям нейросетей ещё не удалось решить до конца — Sostav рассказал о них в своём материале.
Обрезанные головы и перекошенные лицаБывает и такое, что нейросеть генерирует арт с человеком с урезанной головой или вовсе без неё. Дело в том, что при загрузке референсов люди добавляют картинки не во весь рост или такие, где туловище занимает большую часть пространства — нейросеть путается и начинает считать именно торс самой важной частью потрета, позволяя себе обрезать голову.
Также «дипфейковые» глаза движутся неестественно быстро — это отметил журналист The Verge, протестировавший новую функцию. На части видео он смотрит в камеру, так что зритель может увидеть разницу между тем, как это выглядит при обычной съёмке и после обработки ИИ. Кроме того, наличие и отсутствие очков никак не сказалось на качестве изображения.
Лишние зубы, языки и челюстиПорой нейросеть рисует зубы и другие детали рта не лучше рук: рот во рту, челюсть на челюсти, кривые зубы или безумное их количество. Как и в случае с конечностями, ИИ понятия не имеет, как изобразить много похожих объектов в рамках одного, и почему конечный результат не выглядит натурально.
Однако хуже обрезанной головы может быть только плохо нарисованная голова с перекошенным лицом. Это не редкость в работах ИИ. Нейросеть может неестественно расположить части лица и слить его с пространством. Понятия «естественно» у технологии нет, а так как все люди разные, при поиске универсальных решений ошибки неизбежны.
«Что-то с глазами»Эту проблему продемонстрировали многочисленные эксперименты с нейросетью Lensa, в которой пользователи делали для себя аватарки в различных стилях по фото. Многие жаловались на косые глаза и странный взгляд на изображениях. Причём отбраковывать такие картинки было особенно обидно — в остальном многие из них выходили красивыми и яркими.
Размытые детали, пятна и линииБывает такое: арт от нейросети кажется красивым и детализированным, но если начать присматриваться, то оказывается, что никакие конкретные детали там не прорисованы. Эта проблема встречается чаще, чем может показаться: вместо цветов — пятна, вместо птиц — пятна, вместо надписей — линии и пятна. Формы напоминают то, что должно быть изображено, но ничего в сущности разглядеть на таких картинках нельзя.
В конце ноября фоторедактор Lensa возглавил рейтинг наиболее скачиваемых на платформе iOS в России и Беларуси. Для создания аватаров пользователю нужно загрузить в Lensa от 10 до 20 своих фотографий, после чего нейросеть выдаст от 50 до 200 сгенерированных портретов.