Содержание статьи
Нейросети, доступные в России: как подключиться и использовать
На каких языках «общается» ChatGPT
- Через сайт chat.openai.com или мобильное приложение для iOS и Android, где можно « беседовать » с интерактивным помощником, в том числе на русском языке. К сожалению, сайт и приложения для смартфонов в РФ доступны лишь через VPN, использование которого официально запрещено.
- С помощью Telegram-бота. В этом мессенджере представлены разные боты, использующие функционал ChatGPT через официальный API. Проблема в том, что большинство из них работает некорректно, а некоторые находятся в руках мошенников. Использовать их можно, но рискованно. Иногда боты воруют личные данные пользователей.
Некоторые пользователи обходят недоступность нейросети, регистрируясь на сайте OpenAI, используя телефонный номер другой страны. На него приходит код подтверждения, позволяющий завершить регистрацию. Купить виртуальную сим-карту можно, например, на сервисе 5sim.biz. Также для регистрации требуется электронный ящик.
Если вы не дали чат-боту исчерпывающую информацию, то и ответ будет неточным. В таком случае, нейросеть «придумает» неизвестные данные самостоятельно и, скорее всего, выдаст некорректный результат. Задавать уточняющие вопросы ChatGPT вряд ли будет, хотя он умеет это делать.
На самом деле количество доступных в России нейросетей гораздо больше. Мы не упомянули, например, Craiyon, Dream, Colorize, Starryai, CopyMonkey, Turbotext, Wordify, Notion AI и многие другие. Однако нужно понимать, что далеко не всегда это полноценные нейросети, такие же, как описаны выше, – нередко речь идет лишь о плагинах, воплощающих отдельные функции. Например, Colorize – это AI-сервис, который раскрашивает черно-белые фото и видео в натуральные цвета. Очевидно, что это хотя и полезный, но узкоспециальный инструмент. Кроме того, многие ИИ-продукты и плагины, доступные сегодня на рынке и работающие с текстом и кодом, основаны на базе разных версий ChatGPT или других известных моделей. На самом деле в этом нет ничего плохого – наоборот, отдельные энтузиасты, создавая узкоспециализированные приложения, последовательно развивают возможности неройсетевых моделей в различных направлениях до экспертных. Отдельно хотелось бы отметить сегмент обучающих нейросетей, например Character AI, Perplexity, Socratic и многие другие. В основном это разновидности ИИ-ассистентов, способных помогать учащимся в решении задач (физика, химия, математика и т.д.), освоении программирования и улучшении определенных навыков (например, восприятия иностранной речи на слух или произношения). Мы осознанно почти не затрагивали технические особенности создания и обучения больших языковых моделей, потому что их можно обсуждать так же долго, как достоинства и недостатки каждой из них. Одно неоспоримо: умение взаимодействовать с нейросетями, в частности грамотно строить запросы и хотя бы на минимальном уровне понимать, как они работают, де-факто уже стало обязательным. Поэтому, если вы еще не шагнули в мир нейросетевых технологий, самое время попробовать.
GigaChat – это русскоязычная мультимодальная нейросетевая модель, способная вести диалог, отвечать на вопросы, подготавливать тексты и формировать изображения по запросу. Для доступа к GigaChat необходимо посетить официальный сайт чат-бота либо запустить его в Telegram или «ВКонтакте». Ситуация с доступом к нейросети противоположная ChatGPT: если там нужен зарубежный IP, то для доступа к GigaChat от «Сбера», наоборот, необходим российский IP, а авторизация осуществляется через «Сбер ID». Если вы пользуетесь «Сбербанком Онлайн», то «Сбер ID» – это номер вашего телефона. В России GigaChat функционирует без ограничений. Как и ChatGPT, он отлично подходит для интеграции в сторонние чат-боты и сервисы. Запросы также можно осуществлять на разных языках. Для личного использования нейросеть предоставляется бесплатно (freemium-режим). Речь идет об 1 млн токенов (единицы информации, на которые делятся запросы) без дополнительной платы ежегодно: 950 000 токенов для GigaChat Lite и 50 000 токенов – для GigaChat Pro. Если токены закончились, их можно докупить. Для бизнеса чат-бот платный: минимальная стоимость – 600 рублей в месяц при 0,2 рубля за 1000 токенов. В GigaChat используется совокупность нейросетевых моделей, которую разработчики назвали NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Изначально использовалась модель ruGPT-3 размером 13B (то есть с 13 млрд параметров), обученная на корпусе данных в 300 Гбайт (книги, новостные заметки на русском и английском языках, научные статьи и т. п.). Потом использовались ruGPT-3.5 и FRED-T5. В настоящее время ядром чат-бота GigaChat является GigaChat версии 29В (29 млрд параметров). Для работы с изображениями используется отдельная модель «Кандинский» версии 3.1 (Kandinsky 3.1). Как и в случае с другими нейросетями, при работе с GigaChat особое значение имеет грамотно составленный запрос (промпт). Кстати, не стоит забывать, что нейросети могут отвечать похожими фразами на одни и те же вопросы, но каждый раз ответы будут хотя бы немного различаться, так как генерируются заново.
Принципы работы с подавляющим большинством чат-ботов довольно просты. Взаимодействие с ними осуществляется в рамках непосредственного диалога, во многом похожего на беседу людей в реальном мире. Некоторые нейросети воспринимают запросы к себе в свободной форме, другие требуют соблюдения некоторых правил, в том числе грамматических. Самое главное, что требуется от пользователя при общении с любой нейросетью, – четкое понимание, что необходимо получить в результате совместной работы. Обычно необходимо определиться с целевым контентом, с тем чтобы правильно выбрать соответствующий инструмент. Дело в том, что универсальных нейросетей не так много, тогда как большинство ИИ-инструментов заточены под определенный тип данных (текст, изображения, видео, аудио и т. п.). Далее очень важно указать максимальное число деталей, которые могут описывать желаемый результат, – это может быть цветовая палитра и/или стиль, которому должен соответствовать контент. Например, можно попросить нейросеть подготовить рассказ о черных дырах в научно-популярном стиле или нарисовать (а точнее сказать, «сгенерировать») закат на море в стиле импрессионистов. Отдельно можно задать нюансы подачи текстовой или визуальной информации. Например, попросить раскрыть тему, не упоминая определенные ее аспекты. И, пожалуй, самая главная особенность рабочего процесса с чат-ботом – последовательная доработка контента. То есть если пользователь недоволен промежуточным результатом, он продолжает уточнять запросы для нейросети до тех пор, пока не добьется нужного исхода. В связи с этим в Сети появилось немало мемов, так как нейросети иногда упорно отказываются выполнять какие-либо действия либо выполняют их очень своеобразно, что приводит к нелепым или смешным результатам. Что касается работы с отдельными плагинами (например, для интернет-браузеров), в которые встроены некоторые функции нейросетей, то здесь принципы взаимодействия плюс-минус те же, однако с поправкой на особенности конкретного приложения.
Работать с чат-ботом можно через специальные сайты, причем абсолютно бесплатно. Такую возможность предлагает в том числе площадка chat.chatlulu.com. Новому пользователю потребуется регистрация. За нее дадут 1000 золотых на 100 запросов к нейросети. После будет доступен только бесплатный тариф с 5 вопросами в день.
Правда, понимание вопросов и уровень ответов отличаются в разных случаях. Корректнее всего нейронная сеть работает на английском, так как сначала ее обучили работе именно на англоязычном контенте. На русском языке ChatGPT действует несколько хуже. Правда, проблема устраняется при переходе на платный тариф.
Проверяйте факты
Про нейросеть Kandinsky 3.1 от «Сбера» мы уже говорили, однако она заслуживает отдельного от многофункционального чат-бота GigaChat упоминания. Впервые эта генеративная модель появилась в конце 2021 года под названием ruDALL-E XL, она способна создавать изображения по тексту, новые изображения на основе загружаемых в нее, дополнять готовые изображения новыми деталями, смешивать одно с другим, а также создавать небольшие видеоролики. Видеофункции – пока что самое слабое ее место: генерируются долго, а их качество оставляет желать лучшего. Что касается статических изображений, то некоторые пользователи считают эту нейросеть достойным конкурентом Midjourney и Stable Diffusion. Доступные языки запросов – русский и английский. Пользователям доступно неограниченное количество изображений в бесплатном режиме. Чтобы узнать актуальные способы доступа, рекомендуем посетить официальный сайт нейросети Kandinsky (раздел веб-портала «Сбера»), там всегда выложены все рабочие в данный момент варианты. Впрочем, для большинства потенциальных пользователей основным способом попробовать модель в действии остается портал Fusion Brain , созданный командой Института искусственного интеллекта (AIRI). Первой и пока единственной нейросетью, к которой организован доступ на портале, является Kandinsky: удобный и интуитивно понятный интерфейс, простая регистрация с помощью адреса электронной почты. Также доступ к нейросети можно получить с помощью ботов в социальной сети «ВКонтакте» и мессенджере Telegram. Кроме того, существует отдельный Telegram-бот исключительно для генерации видео, однако доступ к нему предоставляется только после рассмотрения предварительной заявки. По умолчанию везде используется новейшая модель нейросети версии 3.1, однако в ботах при желании можно переключиться на предыдущие версии 2.2 и 2.1.
Это чат-бот, представляющий собой текстовый диалог с реальным пользователем. Его работа базируется на нейросети, обученной на больших массивах данных, включая статьи из интернета, переписки в социальных сетях и блогах, образовательных книгах. Так как работа ChatGPT основана на информации из разных областей, этот чат-бот умеет отвечать практически на любые вопросы. Он одинаково хорошо решает задачи по математике, рассказывает о последствиях отмены крепостного права в России и придумывает фантастические истории на основе исходных данных.
В портфолио генеративных моделей «Яндекса» сейчас наиболее актуальна серия YandexGPT 3 . Компания позиционирует ее как качественный вспомогательный инструмент для использования в ИТ-продуктах и решения бизнес-задач широкого спектра. Первенец этой серии – YandexGPT 3 Pro – доступен в сервисе Yandex Cloud. Как обычно, новая версия лучше справляется с пониманием запросов и решением поставленных задач. Согласно оценкам с помощью методики YaMMLU_ru, процент верных ответов чат-бота при запросах на русском языке вырос с 55% в YandexGPT 2 до 63% в YandexGPT 3. Аналогичные показатели у Llama-2 70B и ChatGPT-3.5 Turbo по той же методике составляют 59% и 58% соответственно. То есть на русском языке новая версия справляется лучше зарубежных аналогов. Однако не нужно забывать, что нейросети все еще ошибаются, (это касается не только YandexGPT 3, но и всех остальных чат-ботов). Тем не менее количество фактических ошибок в YandexGPT 3 снизилось до 13,5%, что на 2,9% меньше, чем в предыдущей версии этой большой языковой модели, а в категории «неподтвержденная информация» упало с 6,4% до 5%. Помимо некоторых преимуществ работы YandexGPT 3 на русском языке (в сравнении с зарубежными аналогами), разработчики утверждают, что новая версия превосходит ChatGPT-3.5 Turbo в вопросах, затрагивающих узкие классы бизнес-задач. Для достижения этого ее дополнительно обучали на задачах, возникающих в специфических рабочих процессах. В «Яндексе» полагают, что их сервис будет полезен менеджерам продуктов, разработчикам, директорам по данным (CDO) в самых разных областях экономики (финтех, ретейл, промышленность и т. д.). Для того, чтобы начать работать с YandexGPT API, необходимо пройти аутентификацию в Yandex Foundation Models . Обычные пользователи могут попробовать работу в двух деморежимах на выбор – чат или промт, достаточно авторизоваться с помощью «Яндекс ID». Для тестирования бизнес-задач нужно перейти в режим Playground (интерфейс в консоли Yandex Cloud).
Несмотря на то, что чат-бот официально недоступен в России, не упомянуть его нельзя – это самая популярная и одна из наиболее развитых нейросетей на сегодняшний день. В мае 2024 года была представлена последняя публично доступная версия модели – GPT-4o (где «o» значит «omni»). Новинка способна в режиме реального времени анализировать все основные виды данных – текст, аудио, изображения, видео и комбинации из них – и генерировать в ответ текст, аудио, изображения и комбинации из них. Чат-бот способен реагировать на входящие аудиозапросы со скоростью 232–320 мс, что сопоставимо с реакцией среднестатистического человека в процессе обычной беседы. Что касается текстового режима работы, то производительность GPT-4o соответствует GPT-4 Turbo на английском языке и языках программирования, однако с другими языками, доступными в модели, новая версия стала работать гораздо быстрее. Кроме того, ChatGPT-4o лучше «видит» и «слышит» в сравнении с предыдущими моделями. Средняя задержка в голосовом режиме общения с чат-ботом версии GPT-3.5 составляла 2,8 с, а с GPT-4 – 5,4 с. Такая высокая задержка в предыдущих версиях нейросети связана с тем, что ранее голосовой режим ввода функционировал с использованием трех отдельных моделей, работавших в виде конвейера. А в GPT-4o реализована единая модель сквозного анализа и обучения с помощью разных типов данных. Разработчики признают, что это первая модель компании OpenAI, в которой используется подобный подход, в связи с чем они изучают ее возможности и ограничения вместе с пользователями. Новая модель может напрямую оценивать тон собеседника, его эмоции, определять фоновые шумы и многое другое, поддерживает множество языков запросов, в том числе русский. А также может генерировать тексты на разные темы, поддерживать беседы, писать стихи, решать математические задачи, анализировать, исправлять и писать с нуля код на языках программирования, петь и т. д. Помимо технологических достижений, OpenAI обещает делать все возможное для того, чтобы ее модель была доступна как можно большему числу заинтересованных пользователей по всему миру, к тому же на бесплатной основе. В этом определенно есть доля лукавства, так как чат-бот ChatGPT доступен не во всех странах. Да и лимиты на запросы в бесплатной версии не сильно впечатляют: их количество зависит от загрузки серверов компании в конкретный момент времени, а так как сейчас наблюдается ажиотаж, то рассчитывать на существенные квоты не стоит.
Такую возможность хорошо использовать для сохранения и выделения основных моментов диалога. Так, можно записать общение по телефону на диктофон, перевести аудиозапись в текст через бесплатный инструмент Whisper JAX, вставить текстовый материал по частям в нейронную сеть и попросить ее выделить основные моменты.
Тем не менее регистрация в версии ChatGPT-4o действительно стала проще – больше не требуется зарубежный номер телефона (как было в предыдущей версии), достаточно воспользоваться любой электронной почтой или сервисом быстрой авторизации от Google, Microsoft и Apple. Однако OpenAI, как и прежде, ограничивает возможность регистрации с российских IP-адресов. Если для регистрации аккаунта в ChatGPT вы не желаете или не можете временно изменить свою геолокацию, то чат-бота можно протестировать с помощью посреднических сервисов, например LMSYS Chatbot Arena . В разделе Direct Chat можно из списка выбрать нужную модель, в том числе ChatGPT-4o, и отправить запрос. Однако проблема чрезвычайно малого числа бесплатных запросов на сервисах посредников ощущается еще сильнее. Кстати, судя по всему, до релиза ChatGPT-5 осталось совсем немного.