Содержание статьи
Что такое нейросеть: как устроен человеческий мозг «в цифре»
Программы и плагины Topaz AI
А если закрасить только часть — например, сделать маску на месте головы, нейросеть нарисует новую в нужном стиле, и даже более-менее прилично присоединит её к туловищу (примерно на уровне человека, второй раз в жизни открывшего фотошоп). К сожалению, на человека с фотографии сгенерированные головы не похожи совершенно.
Midjourney — одна из самых популярных нейросетей, с которыми можно работать онлайн. Вот в этом тексте мы писали о том, как генерировать в ней картинки по текстовому запросу. С изображениями она тоже умеет работать — для этого понадобится загрузить картинку на какой-нибудь хостинг, и вставить ссылку в запрос сразу после команды /imagine. Ну а после этого уже написать, что с ней сделать. Например, можно попробовать сделать портрет мужа из пиццы:
В следующей задаче нейросеть попыталась убрать девушку и сделать фотографию шире, дорисовав море слева. Нарисовать воду вместо девушки «Кандинский» смог, но Adobe Photoshop справился бы с этим не хуже и наверняка быстрей — у нейросети ушло около полутора минут. А вот вода слева неплохо смотрелась бы на картине Айвазовского, но с фотографией стыкуется плохо.
Воспользоваться им можно на сайте, через расширение для браузера или мобильное приложение. В последнем доступны 29 языков. Для отдельных языков также действует перевод текста из документа, из загруженной картинки или ввод прямо через микрофон или камеру. В бесплатной версии пользователь может за один раз перевести до 3000 знаков. Также отображается история переводов, а тексты, к которым нужно будет вернуться позднее, можно сохранить в отдельной вкладке.
Одно из главных преимуществ приложения — комьюнити. В Starryai можно не только создавать изображения, но и делиться ими, просматривать ленту с работами других участников, лайкать, обсуждать и вдохновляться. Кроме того, можно принять участие в тематических ивентах.
Однако возрождение интереса к нейронным сетям и революция в глубоком обучении произошли лишь в последние годы благодаря индустрии компьютерных игр. Современные игры требуют сложных вычислений для обработки большого числа операций. В итоге производители начали выпускать графические процессоры (GPU), которые объединяют тысячи относительно простых вычислительных ядер на одном чипе. Исследователи вскоре поняли, что архитектура графического процессора очень похожа на архитектуру нейросети.
Программы от Topaz Labs умеют избавляться от шума, увеличивать размер изображения и спасать нерезкие фото. При этом, благодаря нейросетям, обученным на тысячах реальных фотографий, программы «знают», что скрывается за шумом и нерезкостью. В результате при восстановлении фотографии программы Topaz самостоятельно воссоздают детали, которые вообще отсутствовали из-за шума, маленького размера или нерезкости.
Нейросети чаще всего обсуждают в контексте генерации текстов и изображений. Но на самом деле их уже давно используют в работе сервисов для перевода, улучшения качества фотографий и даже общения. Выбрали шесть таких мобильных приложений, чтобы нейросети всегда были под рукой.
Востребованность специалиста по нейросетям
Luminar умеет находить и ретушировать людей (можно сгладить кожу, сделать глаза выразительней и заставить человека похудеть или потолстеть), может усилить боке на портретном фото, самостоятельно отыскав на нём человека и размыв фон. Есть удобный инструмент для автоматического удаления проводов с фотографий. Он не всегда справляется идеально, но большую часть проводов он находит и удаляет, экономя время фотографа.
Среди них есть такие, как Skin Smoothing (Выравнивание цвета кожи) для быстрой ретуши кожи, Colorize (Тонирование) для раскрашивания чёрно-белых фотографий, Makeup Transfer (Перенос макияжа) и Smart Portrait (Умный портрет), способный поменять грустное выражение лица на улыбку и наоборот.
Для работы в отрасли потребуются знания в области математики, статистики и основ программирования: знание языка Python, навыки работы с Linux, библиотеками Python для Data Science, в том числе Numpy, Matplotlib, Scikit-learn, навыки работы с базами данных, библиотеками машинного обучения PyTorch и TensorFlow.
По сути, это довольно продвинутый редактор, рассчитанный как на начинающего, так и на продвинутого пользователя. Любитель может применить один из готовых пресетов, предназначенных для улучшения фото в разных жанрах. Есть пресеты для пейзажей, для выразительных закатов, стрит-фотографии, портретов в высоком ключе и многого другого. При этом Luminar анализирует открытое фото и сразу предлагает несколько пресетов, подходящих для улучшения фотографии.
Эти «веса» помогают определить важность той или иной переменной во входных данных. При прохождении каждого слоя входные данные умножаются на их «веса», а затем суммируются. Если получившееся значение выше заданного порога, то нейрон активируется и передает данные на следующий уровень.
При глубоком обучении специалист по работе с данными предоставляет нейросети только необработанные данные, а та самостоятельно извлекает функции и обучается независимо. Если результат неудовлетворительный, то цикл обучения повторяется снова, пока нейросеть не будет давать корректные ответы.
А в свежей бета-версии фотошопа появился новый нейросетевой инструмент Generative Fill. С его помощью можно убрать лишние элементы с фотографии, можно расширить изображение, заполнив с помощью нейросети пустые области, поменять причёску модели или нарисовать замок в пейзаже и облака над ним.
В последние годы нейронные сети прошли путь от простых сортировщиков картинок на смартфонах до помощников в решении глобальных задач в науке. Современные нейросети способны заменить или дополнить работу человека во всех случаях, когда решение нужно принимать на основе предыдущего опыта. «РБК Тренды» разбирался, как устроены и работают нейросети, как их обучают и в каких сферах применяют.
Специалисты по нейросетям
Востребованность специалистов по нейросетям постоянно растет. По данным сервиса по поиску работы HeadHunter за 2022 год, на российском рынке наблюдается нехватка соискателей на должности разработчиков систем искусственного интеллекта — на одну вакансию в этой сфере претендуют не больше двух кандидатов. По словам представителей рынка, проблема сохраняется уже в течение трех лет.
Приложение с удобным доступом к генерации изображений с помощью нейросети. Чтобы начать работу, нужно лишь зарегистрироваться. Starryai предлагает сгенерировать от 4 до 8 изображений на основе текстового запроса, фотографии или скетча. Также можно выбрать стиль будущей генерации и по желанию воспользоваться расширенными настройками, например указать размер готового рисунка. Создание каждого нового изображения занимает несколько минут (пользователю приходит уведомление о готовности) и расходует внутреннюю валюту. Заработать ее можно, выполняя задания, например посмотрев рекламу или поделившись работой в соцсетях.
Есть на этом сайте и немного странный инструмент Reimagine XL. Работает он на основе нейросети Stable Diffusion и позволяет создать несколько нейросетевых вариантов загруженной картинки. При этом как-то контролировать процесс или подсказывать нейросети нельзя.
Во-вторых, чтобы добиться нужного результата от Stable Diffusion, придётся потратить время и разобраться в тонкостях её работы. У этой нейросети, как и у любой уважающей себя программы с открытым исходным кодом, существуют разные сборки и множество моделей генерации. Плюс различные расширения, которые должны помочь в работе — их нужно устанавливать отдельно и разбираться ещё и с их настройками.
В DeepL есть версия Pro, которая работает на всех устройствах, — достаточно зарегистрироваться, оплатить подписку и войти в аккаунт. Премиум-пользователи получают возможность работать с текстами неограниченного объема, а данные удаляются с серверов сразу же после перевода.
Специалист по нейросетям должен быть знаком с передовыми методами разработки программного обеспечения, особенно с теми, которые касаются проектирования системы, контроля версий, тестирования и анализа требований. Также ему потребуются знания в области Data Science, такие как моделирование данных, оценка алгоритмов и моделей прогнозирования. Наконец, для презентации работы нейросети потребуется пользоваться технологиями пользовательского интерфейса, использовать диаграммы или визуализации.