Содержание статьи
Midjorney нейросеть как работает
Шаг 1: переход в Discord
Midjourney может создавать картины, делать стилизации в духе популярных фильмов, а также выдумывать облики сказочных существ. Если раньше для того, чтобы заниматься графикой, требовался талант или специальное образование, то благодаря Midjourney воплощать свои графические идеи смогли даже те, кто вообще не умеет рисовать.
Пока что нейросети не до конца научились делать симметричные объекты, поскольку не совсем понимают, что же они рисуют. За время обучения алгоритмы хорошо усваивают, как устроены лица и морды животных, симметрия тела и насекомых. При этом им пока что не под силу опознать устройство, например, человеческой одежды. Нередко пиджаки имеют полы разной длины, левая часть предмета не соответствует правой. Симметричные узоры также выглядят идеальными лишь на первый взгляд ― творчество нейросети в них выдаёт несовпадение в мелочах, если приглядеться.
Разработчики нейросетей редко используют термин «искусственный интеллект», они придерживаются понятия «машинное обучение». Суть его не в решении задачи по конкретному алгоритму, а в создании алгоритма на основе многих аналогичных задач. Ещё один термин ― «глубокое обучение» (с англ. «deep learning»). Это одно из направлений машинного обучения, которое работает с большим объёмом данных (big data) для поиска закономерностей и взаимосвязей.
Нажмите на белую иконку с корабликом в левом меню, чтобы перейти в чат Midjourney. В нём вы увидите сообщения разработчиков об обновлениях. Вам же нужно перейти в блок Newcomer Room ― раздел для новых пользователей ― и выбрать в нём чат, название которого начинается с newbies.
Нейросети хорошо справляются с крупными планами, поскольку они содержат меньше деталей. Ведь чем больше разнородных элементов на картинке, тем сложнее не ошибиться в их воспроизведении. По этой же причине нейросети почти всегда размывают фон за главным героем.
Midjourney сегодня ― один из лучших инструментов для создания изображений при помощи искусственного интеллекта. Алгоритмы сети постоянно совершенствуются и хорошо интерпретируют задания пользователей. Нейросеть по-прежнему совершает ошибки, которые выявить становится всё более сложно. К сожалению, сейчас её бесплатные возможности сильно ограничены, но недорогая подписка предоставляет широчайшие возможности для использования заложенного в сеть функционала.
Как работает нейросеть?
Несмотря на то что нейронные сети быстро учатся, они ещё не могут разбираться в исторических и культурных реалиях. И здесь бывает много смешных ошибок. Например, три одновременно надетых православных крестика, ордена за военные заслуги, распределённые по всему мундиру, нелепая шляпка, не соответствующая эпохе. Именно поэтому нейросетям лучше всего даются вымышленные, фантастические сюжеты.
Режимы Style от low до high задают, насколько творчески сеть должна подходить к технике рисунка. Чем более высокий уровень выставлен в настройках, тем свободнее будет стилизация изображения. Эффект может быть интересным, но управлять фантазией нейросети сложно.
Миджорни может создавать любые самые невероятные иллюстрации, например, можно попросить сделать картинку в стиле Вермеера, на которой будет компания друзей в баре вместе с лосями и лягушками. Единственное ограничение связано со способностью человека сформулировать текстовую подсказку и возможностью Миджорни понять ее. Также в генератор встроен фильтр, который не дает генерировать порнографические картинки и иллюстрации с насилием.
На базовом тарифе можно генерировать изображение суммарно чуть более трёх часов, причём только в ускоренном режиме. Тариф Standart стоит 30 долларов в месяц, в нём доступна опция медленной загрузки процессора, и время для генерации изображений не ограничено.
Работа любой нейросети схожа по своей сути с работой человеческого мозга, отсюда и пошло название “искусственный интелект”. Как и у человеческого мозга, внутри нейросети есть цепочка, выстроенная из нейронов. Они изучают новый объект, исследуют его, а затем, на основе полученной информации учатся, дополняют её новыми знаниями, допускают ошибки и исправляют их.
Недавно команда разработчиков представила миру ещё один вариант создания изображений с помощью нейросетей — нейросеть Midjourney. Суть нейросети заключается в том, что она способна распознавать печатный текст и преобразовать его в картинки. Для этого нужно написать запрос на английском языке предмета или объекта, который вы хотите увидеть.
Всё это делается на основе искусственного интеллекта, обученного на огромном количестве фотографий в сети интернет. Как только Midjourney найдёт наиболее подходящие снимки из имеющихся, она может создать из них композицию. Если пользователь не указал, на какую тему должно быть сделано изображение, то Midjourney сама выберет подходящую.
Многие думают, что если изображение создала нейросеть, то права на него автоматически принадлежат пользователю-автору, ведь нейросеть ― это технология и обладать авторскими правами она не может. Но всё не так просто. Разработчики вложили в создание сети немало ресурсов, а сама Midjourney принадлежит компании Midjourney Inc.
Сколько стоит Midjourney
Итак, Миджорни, как и любые другие генераторы изображений, умеет учиться, а значит, постепенно понимать, что такое та или иная вещь. Миджорни использует миллионы текстовых описаний и картинок, чтобы запомнить, что такое собака, стол, стул и красный цвет. Дальше генератор становится искусственным интеллектом, который может интерпретировать практически любую подсказку.
Разработчики Миджорни пока что не выпустили свой API — программный интерфейс приложения. Когда API будет выпущен, это позволит разным приложениям и веб-платформам интегрироваться с Миджорни. По этой причине единственный официальный способ использовать Миджорни — через бота в Дискорде. Дискорд — это приложение для общения, похожее на Слак.
Несмотря на то что громко заговорили о нейросетях лишь недавно, такие корпорации, как Google, Apple, «Яндекс» начали использовать возможности ИИ более десяти лет назад. Так, ещё в 2009 году «Яндекс» интегрировал в свою поисковую систему метод «Матрикснет», который строит ранжирование ссылок на основе обучения. А в 2010 году Apple приобрели Siri ― она распознаёт речь с помощью искусственного интеллекта.
В нынешнее время нейросети являются отличным подручным средством для людей, работающих с данными и информацией. Сейчас умные программные обеспечения умеют писать тексты, редактировать фотографии, создавать картинки по запросу, генерировать видеоролики. Нейросети применяются в компьютерах автомобилей и машинном обучении. В голосовых помощниках и умных устройствах.
В одной из статей мы уже описывали некоторые нейросети и принципы их работы. Сегодня хотелось бы поведать о одной из самых известных нейросетей на данный момент.
Следующий шаг — это сам рендеринг изображения. Для этого используется процесс, который называют диффузией: нейросеть начинает со случайного шума и в несколько этапов редактирует его в соответствии со своей интерпретацией подсказки. Это как посмотреть на небо, увидеть облако, которое похоже на собаку, щелкнуть пальцами и сделать из него сначала очертания мопса, а затем и четкую картинку.
Очень часто нейросети изображают руки с большим количеством пальцев, положение которых далеко от физиологичного. Проблема частично устранена только в последней версии Midjourney, при более ранних версиях приходилось использовать сторонний плагин, исправляющий эту ошибку.