Содержание статьи
Картина сетевым маслом. Как нейросеть видит новостную повестку России
Нейросеть рисует Россию будущего
«Таблица Менделеева — как пришла ее идея». Согласно расхожей легенде, Дмитрий Иванович Менделеев, НЕ придумывал свою великую таблицу разумом, а увидел ее во сне сразу в законченном виде. Позднее из нее исчез таинственный эфир, вместе со всей строкой, где он был расположен (последние книги и справочники с упоминанием эфира выходили в печать в начале XX века). Не знаем откуда, но нейросеть, кажется, «знакома» с этой историей — выданные ей варианты гораздо больше связаны с некой таинственной субстанцией, нежели с самой таблицей Менделеева, какой мы знаем ее сегодня.
Придумать несуществующий пейзаж? А может, несуществующего человека? Нейросеть уже переносила действие культового фильма «Один дома» в СССР, визуализировала русские поговорки и даже представляла, как бы постарели знаменитости, если бы им не помогали пластические хирурги. Если и есть сейчас самый обсуждаемый художник, то это точно она.
Работают они по принципу «нейронных» связей мозга — то есть пропускают достаточно сложные входящие запросы через несколько самостоятельных программных алгоритмов, которые, взаимодействуя в процессе работы между собой, генерируют некий цельный финальный результат на выходе. Среди наиболее известных — Midjourney, Neural love, , и другие.
«Таинственное сакральное место в лесах Сибири». Видим некое святилище вырубленное внутри пещеры или скалы. На стене — то ли икона, то ли другое, под ногами — мегалиты, на заднем плане — непроходимый лес в тумане. А, может, есть и поныне такие сакральные места, о которых знают лишь единицы, или вовсе никто и которые еще предстоит отыскать, а их значение — осмыслить?
Попробуем другую тему: «русские ученые в будущем работают над принципиально новой технологией». Первое приближение дает нам интересный футуристичный фон и узнаваемые фигуры в неких полувоенных бушлатах. На головах то ли каракулевые шапки, то ли скафандры — видимо, нейросеть не смогла определиться какая атрибутика важнее — нечто типично русское в ее понимании, или же тема будущего.
При этом можно дополнительно уточнять десятки параметров: стилистику изображения, атмосферу и особенности композиции, необходимое количество деталей и даже освещение. Можно запрашивать новые вариации к уже созданным картинам, уточняя таким образом направление поиска.
Все они позволяют любому (!) пользователю бесплатно (но обычно есть лимит команд и/или разрешений) ввести в строку запрос с описанием картины, которая ему нужна — от простых до самых фантастических. Это может быть «пятый элемент», «вечный двигатель», «как на самом деле строили пирамиды» и проч. — и в течение 5–10 секунд получить подборку из нескольких изображений на выбор, каждое из которых в целом сопоставимо по качеству с реальной иллюстрацией, созданной человеком.
Справедливости ради отметим, что мы указывали в запросе, что город должен быть красивым, а изображение красочным. Если вы введете тот же запрос с уточнением «мрачный», то подборка, конечно, будет совсем другой. Впрочем, образ получился довольно узнаваемым и родным — некая футуристичная комбинация Кремля, сталинской архитектуры и церковных куполов. А вы заметили рыбака или монаха в левом нижнем углу? Мы его в запросе не задавали. Это рисует нейросеть)
«Реновация» требует перевода
Мы выбрали два тематических блока. Первый: спецоперация, вирусы, Москва, реновация. Отправляем запрос. Нейросеть обрабатывает его и выдаёт вариант. С реновацией искусственный интеллект явно не справился, зато добавил на картинку высотки МГУ и собор Василия Блаженного. Вполне себе символы столицы! Образы СВО и эпидемии технично объединил в один – перед нами боец в медицинской маске. А над Москвой кинематографично летают огромные вирусы кори.
Для этого сначала мы определились с темами – именно на основании тегов, то есть ключевых слов, сеть и создаёт рисунки. Каждый из них нужно перевести на английский – этот язык сеть пока понимает лучше всего. Тут мы, правда, сразу сталкиваемся с тем, что не все понятия из нашей жизни легко объяснить роботу-иностранцу, – например, вместо короткого слова «реновация» приходится вбивать целое облако тегов.
Так нейросеть видит «допотопный 3000 лет назад с жителями и транспортом». Интересно, что климат кажется гораздо теплее — на фото яркие летние краски и много зелени. В воде угадывается целая россыпь сокровищ (или же это волшебство? Магия воды?), а отражение в воде не совпадает с реальностью, что звучит крайне интригующе, если подумать над этой фразой в разных аспектах.
Начнем с запроса «красивый процветающий русский город в 2100 году». Обратите внимание, что сеть Midjourney работает только на английском, так что ваши запросы нужно будет адекватно перевести. Зато, зарегистрироваться в системе можно буквально в 2 шага — при клике на join вас переправят на сайт другой сайт (Discord), где вы введете действующий и придумаете пароль и все — можно творить! Вы автоматически попадаете в одну из групп для новичков (вроде общего чата на 8–10 человек), где можете вводить свой запрос в строку команд в нижней части экрана, начиная с /imagine (и далее — текст вашего запроса на английском). Все пользователи видят творчество друг друга, что крайне полезно в плане обучения тому, как лучше формулировать запросы. Важно только не «потерять» свою картину в общем потоке команд.
Увеличим один из результатов. Настроение и атмосфера переданы довольно хорошо, а картинку разглядывать интересно. При этом здесь хорошо видно, что изображение состоит как бы из множества слоев/фрагментов. То ли человек развернулся? То ли согнул руку? У него на голове шапка или скафандр? Он стоит спиной или вполоборота? Повсюду пластичность, размытость и некоторая незавершенность — перед нами как бы набросок, эскиз, который можно «развернуть» , без четко установленных границ. Это одна из причин по которой НЕ стоит бояться того, что нейросеть заменит человека и исчезнут дизайнеры или художники. Мы ведь не разучились ходить при изобретении велосипеда и машины. Все что дают эти инструменты — это экономия времени и, применительно, к нейросетям, возможность получить дополнительную порцию вдохновения.
Самым интересным и важным здесь является то, что нейросети самообучаемы — то есть чем больше изображений создают с их помощью пользователи, тем более удачными и отвечающими ожиданиям являются новые картины. Под каждый запрос нейросеть стремится предложить такой результат, который согласно ее собственной накопленной статистике взаимодействия живого интеллекта с искусственным, является наиболее релевантным. Таким образом, нейросеть рисует именно то, что скорее всего подразумевали бы под подобным запросом большинство других пользователей — тем самым она как бы овеществляет и материализует витающие в воздухе устойчивые визуальные образы.