Содержание статьи
12 бесплатных нейросетей на русском языке
Как работает нейросеть Stable Diffusion
На начальном этапе обучения сети сотрудники Stability AI отобрали изображения с метаданными — дополнительной информацией (например, подписью под картинкой на сайте) — и сформировали пул графических данных. Они использовали подмножество из крупного сета LAION-5B, в который входит около 5 000 000 000 изображений из интернета. Большая часть картинок взята с сайтов Getty Images, DeviantArt и Pinterest — благодаря этому Stable Diffusion может применять стили современных художников.
В основе Stable Diffusion лежит техника латентной диффузии — когда в процессе генерации система находит знакомые формы среди большого пула изображений, а затем фокусируется на них при совпадении с запросом. Как нейросеть узнает формы? Этот «навык» она получает в процессе обучения и тренировки.
Что может: писать и переводить тексты на разных языках, генерировать идеи, анализировать текстовые материалы, искать ключевые слова, писать код. Можно использовать, чтобы создавать статьи, рекламные тексты, посты, рассылки и тексты других форматов.
После сбора данных нейросеть обучалась на GPU — сервере с графической картой для сложных операций. Обучение проходило по следующему принципу: система задействовала технологию CLIP (Contrastive Language–Image Pre-training) — генерацию готовой композиции в один этап. Для сравнения, обычно создание изображения происходит послойно: начинается с фона и заканчивается объектом. CLIP же позволяет строить ассоциативные ряды между словами и изображениями. Обучение Stable Diffusion продолжается — это помогает усовершенствовать нейросеть.
Что может: создавать изображения в разных стилях, совмещать две картинки в одну, редактировать иллюстрации и «дорисовывать» их по краям. Сервис сохраняет созданные изображения только во время сеанса, в следующий раз к ним нельзя будет вернуться ― поэтому лучше сразу скачать понравившиеся варианты.
Условия: для работы нужна только учётная запись Google. В бесплатном варианте можно сделать три презентации в месяц, для текста есть ограничение ― 2500 символов. В месяц пользователь получает 10 кредитов, которые нужны для покупки AI-рекомендаций.
Условия: воспользоваться сервисом можно через приложение, а на сайте доступна только лента с чужими публикациями. Количество генераций не ограничено. Также у «Шедеврума» есть правило: нельзя создавать изображения с отсылкой на известных людей — такие промпты блокируются.
Что может: за считанные минуты оформить презентацию на основе вашего текста — достаточно загрузить информацию, выбрать тему и оформление. Сервис поддерживает более ста языков. Расширение скачивается на английском языке, после установки можно поменять язык меню на русский.
SlidesAI
Что может: разработать структуру презентации по заданной теме, а после одобрения от пользователя — написать материал для слайдов. Можно выбрать тон текста, отредактировать его вручную или с помощью ИИ, а также генерировать простые изображения. Сервис на английском языке, но может составить презентацию на русском.
Что может: в режиме реального времени создавать анимацию на основе статичного изображения и преобразовывать текст в речь. То есть можно загрузить фото человека, ввести нужный текст, и D-ID сгенерирует видео, где человек произносит заданную фразу. Сервис с англоязычным интерфейсом, но адаптирован на более ста языков, в том числе русский.
Искусственный интеллект может быть помощником, который возьмёт на себя рутинные процессы или быстро визуализирует сложную идею. Мы сделали подборку сервисов на основе ИИ, которые могут быть полезными дизайнерам и другим специалистам, работающим с визуальным и текстовым контентом.
Промпт: «Том и Джерри сидят у камина в ноябре, в стиле ар-нуво, сине-зелёный фон». Нейросеть сделала иллюстрации в заданном стиле и нужных цветах. Правда, нужно следить за деталями: на первой картинке «поплыла» гитара и у Джерри появился второй хвост, а на второй у него кошачьи уши
Изображение: Microsoft Bing / Skillbox Media
Что может: генерирует видеоролик с аватарами, которые произносят заданный текст. Можно создать аватар на основе своего фото, настроить стиль речи, жесты, фон. У сервиса можно выбрать русско- или англоязычный интерфейс, а генерировать видео можно на девяти языках.
После DALL-E 2 компания Сбер выпустила нейросеть ruDALL-E. Она обладает схожим функционалом, однако ее отличительная особенность — это разнообразие стилей российских и советских художников: например, можно сгенерировать изображение в стиле Казимира Севериновича Малевича и Василия Ивановича Сурикова.
Что может: генерирует тексты разных форматов и на разные темы ― от художественных рассказов и анекдотов до программных кодов. В промпте можно указать не только тематику, но и стиль изложения. Однако полученный текст нужно проверять на смысловые ошибки ― нейросеть может «придумывать» факты.
В апреле 2022 года компания OpenAI выпустила DALL-E 2. Главная особенность этой нейросети — возможность экспериментировать со стилями. Можно сгенерировать картинку в формате реализма, футуризма, а также «примерить» стиль известных художников: например, Винсента ван Гога или Василия Васильевича Кандинского.