Содержание статьи
Подобрать фильм, написать текст, сгенерировать изображение: что умеют нейросети
RYTR
Нейросети пока не могут написать большой и связный текст без помощи человека. Тем не менее они помогут начать статью или рассылку, сформулировать мысль или идею. Сервисы могут быть полезны для копирайтеров, менеджеров и всех, кому приходится или хочется писать.
Ошибка считать, что нейросеть это что-то гениальное или даже сверхразум. Но это же глупости. По факту нейросети – просто сложные программы, работающие на принципах простой линейной алгебры. Это все что угодно, но только не интеллект. Система способна производить преобразование одних матриц в другие. Если когда-то и будет создан полноценный искусственный интеллект, то нейросети будут выступать в качестве мелкого винтика во всем механизме его работы. На данный момент они реально могут помочь с обработкой визуальных данных за счет анализа и группировки по общим признакам.
Нейросети научились создавать впечатляющие иллюстрации, имитировать картины известных мастеров и фотореалистичную графику. Изображения можно добавлять в презентации, посты в соцсетях или использовать для вдохновения. Выгоревшие дизайнеры, иллюстраторы и SMM-специалисты оценят этот инструмент.
В Craiyon нет лимита на количество генерируемых изображений. Нейросеть создаёт девять вариантов по одному запросу, но не всегда следует промпту. По промпту «женщина в деревне, похожая на Джулианну Мур, в стиле Skyrim» нейросеть сгенерировала три иллюстрации вообще без героини.
Если говорить широко, то нейросети очень много чего не могут. Я бы даже сказал, что они пока только и могут обрабатывать изображения. Система способна отлично кластеризовать картинки по общим признакам. Порой механизм может создавать собственные, порой довольно странные изображения. Но это не мозг и даже не искусственный интеллект. Нейросеть – это набор программ, которые создают матрицы на основе входящих данных, тем самым создавая нечто среднее. Так же нельзя сказать, что они творят уникальные произведения искусства. Да, картинки получаются уникальные, но они же созданы на основе полученной информации, после чего она объединяется в единое целое. Это, к примеру, если взять несколько романов и перемешать все страницы в единую книгу, называя это новым произведением. На деле система может только то, чему ее обучили. При этом итоговый результат сложно назвать идеальным. Она учится, но способна только запоминать верные ответы на поставленные вопросы. Нейросеть не может улавливать закономерности. Если подытожить, то можно сказать, что такие системы довольно ограничены в возможностях в сравнении с человеческим мозгом.
Существующие нейросети, которые имеют практическое применение, и даже неплохие показатели работы с изображением, все равно уступают человеку во многом. Такие системы были разработаны еще в 80-х годах прошлого века по типу строения зрения человека. У системы есть фильтры, которые способны сканировать предмет или изображение на основе определенных признаков: контуры и линии. Но дальнейшая обработка существенно уступает человеческому мозгу. В силу этого могу сказать, что нейросеть далеко не всегда хорошо работает с изображениями. Если вы работаете с этими системами, то наверняка может оценить их «странное» творчество. Возможно, в ближайшее время эксперты и допилят принципы работы и точность восприятия, но пока говорить, что нейросеть отлично обрабатывает графические данные — нельзя. Да, я согласен, в некоторых сферах они даже имеют прикладное значение и позволяют существенно упросить работу человека, но все же. А после недавнего выступления Маргариты Симонян и Путина на форуме, где была затронута данная тема – офигел, реально ИИ рулит.
Перевести названия предметов по фото
Инструмент создал разработчик из Google Дэн Мотценбекер на проекте AI Experiments от Google Creative Lab. Нейросеть работает на базе платформы Google Cloud Vision API и переводчика Translate API. Эти технологии позволяют с высокой точностью распознавать объекты на картинках и выдавать машинный перевод. Нейросеть считывает форму предмета, ищет совпадения, распознаеёт вещь и переводит название на выбранный язык. Сервис знает немецкий, французский, испанский, итальянский, китайский, японский, корейский, датский языки и хинди. Иногда инструмент ошибается, но, как и любая технология машинного обучения, учится на своих ошибках и совершенствуется с каждым запросом.
Stable Diffusion — инструмент от группы Stability.Ai. Нейросеть создает картинку по словесному описанию. Она использует в работе кодировщик текста, который описывает каждое слово с помощью списка чисел или вектора. Генератор изображения обрабатывает эти данные и преобразует в пиксельную картинку. Нейросеть уже используют для создания контента — в телеграм-канале АктаНейро можно посмотреть, как Stable Diffusion генерирует изображения к новостям.
Artbreeder подойдёт пользователям, которые хотят сделать необычный арт из своих фотографий. Но для профессиональных дизайнеров возможностей нейросети может быть недостаточно, потому что изображения получаются не очень чёткими и реалистичными, фон сильно размыт.
Нейросети умеют рисовать реалистичные портреты и фантастические арты в любом стиле: от комикса до картин Ван Гога. Благодаря этому они упрощают работу многим специалистам. Особенно дизайнерам, SMM-специалистам и маркетологам. Ведь готовые изображения можно использовать для оформления статей, публикаций в соцсетях, рекламных баннеров.
Не так давно начал работать с нейросетями. Очень увлекательно и пока много сложностей вызывают. Такие системы способны самостоятельно создавать алгоритм на основе вводных данных. Это позволяет с помощью нейросетей генерировать стихи, музыку, рисунки. Хотел бы немного прояснить для себя следующий момент – нейросети хорошо работают с изображениями. Но чего они пока не могут сделать?
Это чат-бот от компании Open AI, разработанный на базе языковой модели GPT-3,5. Нейросеть может вести диалог, рассказывать анекдоты и писать тексты. Модель прошла обучение с подкреплением, получала фидбэк от людей и совершенствовала свои алгоритмы. Этот чат-бот можно использовать вместо поиска, для написания простого кода и поточных текстов, например, карточек товаров для интернет-магазина.
Thing translator
Алгоритмы социальных сетей уже неплохо справляются с тем, чтобы показывать нам контент, который точно нам понравится. Аналогичные инструменты есть для выбора развлечений и занятий на выходные. Вместо того чтобы ссориться о том, какой фильм смотреть в пятницу вечером, доверьте выбор нейросети.
ruDALL-E — русская версия нейросети DALL-E от Сбера. DALL-E — одна из версий модели GPT-3, обученная генерировать изображения из текста. Первый компонент нейросети (CLIP) переводит текст в цифровую среду и создает набросок изображения. CLIP тренировали на датасете из 600 миллионов картинок с подписями. Второй компонент GLIDE детализирует изображение. На финальном этапе алгоритм доводит картинку до максимально возможного уровня качества. DALL-E активно используют в коммерческих целях. Например, журнал Cosmopolitan поместил на обложку изображение, сгенерированное нейросетью.
Artbreeder предлагает несколько инструментов для генерирования: объединение картинок, дорисовка изображений, создание артов по текстовому запросу и фото. Кроме того, можно использовать ползунок, чтобы показать нейросети, насколько новое изображение должно быть похоже на предыдущее или соответствовать промпту.
В Starryai можно создавать арты на ПК и в мобильном приложении, для этого нужно зарегистрироваться или войти в аккаунт Google. Сервис даёт пять кредитов, которые обновляются каждый день. Для генерирования изображения достаточно составить текстовый запрос и выбрать любой художественный стиль.
Важно учитывать, что пользователи из РФ могут столкнуться с проблемой при оплате сервисов, потому что требуется карта иностранного банка. Выходом может быть совмещение в работе профессиональных инструментов с ограниченной подпиской и полностью бесплатных нейросетей.
Автор книги «Before the Brand: Creating the Unique DNA of an Enduring Brand Identity» Алисия Перри подсчитала, что 98% английского словаря состоит из названий брендов. Придумать оригинальное название для бизнеса, которое понравится пользователям, непросто. А после этого еще нужно выбрать цвета, логотип и придумать фирменный стиль. Принять решения и поставить задачу дизайнерам предпринимателю поможет искусственный интеллект.