Что не умеют нейросети

0
17

Безумные руки и «стеклянные» глаза: что до сих пор плохо рисуют нейросети

Лишние зубы, языки и челюсти

Также «дипфейковые» глаза движутся неестественно быстро — это отметил журналист The Verge, протестировавший новую функцию. На части видео он смотрит в камеру, так что зритель может увидеть разницу между тем, как это выглядит до и после обработки ИИ. Наличие и отсутствие очков никак не сказалось на качестве изображения.

Помните, как развивалась ситуация с ковидом? В конце 2019 его не принимали всерьез, в начале 2020 еще шутили о том, как некоторые страны перестраховываются, дальше была паника, период отчаяния от локдауна, а потом люди просто устали от этой повестки. Мы можем чутко реагировать на общественные запросы, базируясь на собственных ощущениях, и менять тон своих текстов, — а нейросети нет.

Примерно так же обучаются нейросети. Их учат распознавать сущности, отвечать на вопросы, писать тексты и выполнять другие задачи. Для этого используют множество данных (датасеты), на которых нейросеть тренируется. Например, если её обучают распознавать кошек, то ей показывают множество фотографий этих животных. При этом нейросеть сама ничего не понимает — она просто делает предположения и сравнивает их с правильными ответами. За правильные ответы её поощряют, а за неправильные — наказывают. Со временем она всё лучше справляется со своей задачей.

Обычным пользователям, которые генерируют контент в нейросетях, любители технологии рекомендуют избегать рисовки рук (такой параметр можно выбрать в интерфейсе отдельных ИИ, включая Midjourney) или изображать их так, чтобы они были заняты. Также повысит шансы на успех детализация кистей рук: лучше подробнее описать, как выглядят пальцы и кожа на них.

Дело в том, что ИИ не осмысливает референсы с точки зрения анатомии и восприятия человека. Кроме того, на многих исходниках кисти рук показаны с разных ракурсов, так что видно разное количество пальцев — а когда предметов много, но неясного количества, машина выдаёт случайный результат.

Эту проблему продемонстрировали многочисленные эксперименты с нейросетью Lensa, в которой пользователи делали для себя аватарки в различных стилях по фото. Многие жаловались на косые глаза и странный взгляд на изображениях. Причём отбраковывать такие картинки было особенно обидно — в остальном многие из них выходили красивыми и яркими.

Подборка проблем в творчестве ИИ — в материале Sostav

Бум нейросетей — тренд последних лет, который набрал обороты в конце 2022 года. Искусственный интеллект (ИИ) стал доступен широкому кругу пользователей как возможность генерировать уникальные изображения и иллюстрировать самые безумные фантазии, так что в интернете уже поговаривают о том, что профессия дизайнера изжила себя, ведь технология уже рисует лучше и быстрее. При этом есть несколько проблем, которые создателям нейросетей ещё не удалось решить до конца — Sostav рассказал о них в своём материале.

Однако хуже обрезанной головы может быть только плохо нарисованная голова с перекошенным лицом. Это не редкость в работах ИИ. Нейросеть может неестественно расположить части лица и слить его с пространством. Понятия «естественно» у технологии нет, а так как все люди разные, при поиске универсальных решений ошибки неизбежны.

Порой нейросеть рисует зубы и другие детали рта не лучше рук: рот во рту, челюсть на челюсти, кривые зубы или безумное их количество. Как и в случае с конечностями, ИИ понятия не имеет, как изобразить много похожих объектов в рамках одного, и почему конечный результат не выглядит натурально.

Чтобы нейросеть не обрезала голову персонажам, можно загружать референсы в полный рост. Запрос к ИИ на изображение человека в полный рост также помогает избежать проблемы обрезки. Кроме того, результат может улучшить детализация — стоит описать, что делает персонаж, его движения и положения конечностей. Но при этом не стоит запрашивать потреты и добавлять положительную оценку: дело в том, что ИИ считает изображения людей с обрезанной головой более привлекательными.

ЧИТАТЬ ТАКЖЕ:  Как собрать искусственный интеллект

Представьте, что вы никогда не видели кошек. Вам показывают фотографию животного и спрашивают: «Это кошка?» Вы отвечаете: «Не знаю». Тогда вам объясняют: «Кошки — это такие животные с четырьмя лапами, хвостом и усами». Вы смотрите на фото ещё раз и понимаете, что это действительно кошка. Так вы научились определять кошек.

Проблема сохраняется и тогда, когда ИИ призван решить проблему зрительного контакта человека с камерой. Недавно компания Nvidia выпустила технологию на основе нейросети, которая позволяет создать имитацию зрительного контакта на видео, если человек не смотрит в камеру. Выглядит это так, как будто ИИ просто поменял расположение глаз — взгляд такой же неживой и расфокусированный, как на многих картинках от нейросетей.

Что генеративный ИИ не умеет?

Это всегда самое важное. Чтобы писать увлекательные посты и статьи, вам нужно понимать, кто их читает — и, соответственно, какую лексику стоит использовать, сколько эмодзи нужно, чтобы расставить акценты, но при этом не «пересолить». Не говоря уже о специфическом сленге, который есть у рыболовов, охотников, автолюбителей, айтишников и т.д. Без него не обойтись, чтобы говорить со своей аудиторией на одном языке. Но посторонний читатель полезет на стенку от всех этих байтраннеров, эджайлов и бабушкоотбойников.

Один из интереснейших вопросов, так как сейчас все наперебой говорят только о том, что ГенИИ умеет — писать, структурировать, строить гипотезы, обрабатывать данные, проявлять креатив и многое другое. Но если мы посмотрим на технологию, то всё-таки увидим ограничения.

Мы вместе с командой Directum разрабатываем и внедряем ИИ-сервисы, которые потом помогают среднему и крупному бизнесу расти и развиваться. Новая технология всегда вызывает множество вопросов, но я только рад на них отвечать. Вот лишь некоторые из самых популярных.

Технология ещё учится, и многие работы уже сейчас корректнее изображают человека и реальные предметы. Есть ли в будущем место человеческим дизайнерам — это открытый вопрос, на который можно будет ответить только спустя годы, наблюдая за развитием искусственного интеллекта.

Бывает и такое, что нейросеть генерирует арт с человеком с урезанной головой или вовсе без неё. Дело в том, что при загрузке референсов люди добавляют картинки не во весь рост или такие, где туловище занимает большую часть пространства — нейросеть путается и начинает считать именно торс самой важной частью потрета, позволяя себе обрезать голову.

Бывает такое: арт от нейросети кажется красивым и детализированным, но если начать присматриваться, то оказывается, что никакие конкретные детали там не прорисованы. Эта проблема встречается чаще, чем может показаться: вместо цветов — пятна, вместо птиц — пятна, вместо надписей — линии и пятна. Формы напоминают то, что должно быть изображено, но ничего в сущности разглядеть на таких картинках нельзя.

Заметили, как в последние недели резко выросло количество контента от нейросетей? Он так быстро становится качественным, что уже понятно: скоро они будут создавать нам и посты, и картинки для них. Это не очень радостная новость для копирайтеров, журналистов и дизайнеров, зато отличная для всех, кто ведет свои бизнес-аккаунты и тратит на это кучу времени.

Главная причина, по которой пользователи критикуют нейросети, — это неумение рисовать руки. ИИ не усваивает форму человеческой кисти и добавляет лишние пальцы или, наоборот, рисует «лапки динозавра», а также в целом искажает конечности. Иногда нейросети даже дорисовывают лишнюю руку или ногу целиком. Причём стиль рисовки здесь не имеет значения: безумные руки можно увидеть и у реалистичных изображений, и у «мультяшных».

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь