Содержание статьи
Как пользоваться ботами нейросетей ChatGPT и Midjourney в «Телеграме» — и стоит ли это делать
Стоит ли искать нейросетевых ботов в «Телеграме»
Разработчики ботов могут вводить в заблуждение. Многие боты называются так же , как официальные нейросети, хотя «под капотом» может скрываться что угодно. Разработчики не раскрывают версии моделей или выдают устаревшие версии нейросетей за актуальные.
Но разрешение у получившихся в «Телеграме» картинок очень низкое. Бот дает одну бесплатную генерацию в сутки. Чтобы сделать апскейл картинки — увеличить ее разрешение — придется ждать следующего дня. После этого бот требует 199 ₽ в месяц за пять запросов в сутки. При этом в официальном Midjourney есть 25 бесплатных генераций, а минимальная подписка стоит 10 $ ( 772 ₽) и дает 3,3 часа генерации в месяц. За это время можно сгенерировать сотни картинок.
В апреле 2022 года компания OpenAI выпустила DALL-E 2. Главная особенность этой нейросети — возможность экспериментировать со стилями. Можно сгенерировать картинку в формате реализма, футуризма, а также «примерить» стиль известных художников: например, Винсента ван Гога или Василия Васильевича Кандинского.
Для подключения нейросети к боту у нее должен быть открыт API — набор инструментов для разработчиков, с помощью которых одна программа может использовать другую. Встроить нейросеть в «Телеграм» можно, если разработчик имеет доступ к коду нейросети.
Вывод. Ботам, которые работают на основе Stable Diffusion, можно доверять. Например, бесплатному Stable Diffusion Generator с неограниченным числом генераций, который поддерживает русский язык. Боты по Midjourney выглядят намного более сомнительными — не рекомендуем ими пользоваться. Dall-E 2 в теории можно встроить в «Телеграм», но гарантий вы не получите.
Есть ли боты именно с ChatGPT. Неизвестно. Боты в «Телеграме» — это черные ящики. Возможно, они используют модели OpenAI, а возможно, какие-то другие. Убедиться в этом на 100% нельзя, поскольку разработчики сами не раскрывают, на каком API работает бот
С чем вы можете столкнуться при использовании ботов
Ботам с GPT-4 в названии сразу не верьте. OpenAI представила GPT-4 только 14 марта. Компания делилась наработками только со считаным числом тестеров, включая приложение Duolingo, банк Morgan Stanley и правительство Исландии. Разработчики смогут получить доступ к API GPT-4 в будущем — открыт лист ожидания.
Базовый ChatGPT работает на версии GPT-3,5 . Основное отличие от версии GPT-3 — наличие «памяти». Модель запоминает детали разговора и может строить ответы, основываясь на информации, которую ей уже сообщил пользователь. Работает с русским языком, но с английским справляется намного лучше.
После сбора данных нейросеть обучалась на GPU — сервере с графической картой для сложных операций. Обучение проходило по следующему принципу: система задействовала технологию CLIP (Contrastive Language–Image Pre-training) — генерацию готовой композиции в один этап. Для сравнения, обычно создание изображения происходит послойно: начинается с фона и заканчивается объектом. CLIP же позволяет строить ассоциативные ряды между словами и изображениями. Обучение Stable Diffusion продолжается — это помогает усовершенствовать нейросеть.
У Dall-E 2 платный API. Для разработчиков генерация одной картинки разрешением 512 × 512 пикселей стоит 0, 018 $. Расходы покрывать придется либо навязчивой рекламой, либо платной подпиской. К тому же нет гарантий, что бот действительно использует модель Dall-E 2 , а не одну из версий Stable Diffusion. Бесплатно Dall-E 2 можно попробовать на сайте OpenAI.
В основе Stable Diffusion лежит техника латентной диффузии — когда в процессе генерации система находит знакомые формы среди большого пула изображений, а затем фокусируется на них при совпадении с запросом. Как нейросеть узнает формы? Этот «навык» она получает в процессе обучения и тренировки.
GPT-4 лучше учитывает контекст, умеет распознавать изображения, хорошо работает с русским языком и сдает сложные экзамены на уровне отличников. В бытовом общении и простых задачах разница между GPT-3,5 и GPT-4 может быть едва заметной. Однако разрыв между версиями становится очевидным по достижении определенного порога сложности задачи. GPT-4 доступна по подписке на ChatGPT.