Содержание статьи
Как пользоваться ChatGPT в России
Возможности ChatGPT
Главная проблема: неизвестно, что скрывается за этими ботами, ведь заглянуть к ним «под капот» нельзя. Там может быть любая языковая модель — как морально устаревшая вроде GPT-3, так и вообще другая, не связанная с компанией OpenAI. Они будут работать намного хуже, чем актуальные версии ChatGPT. Это может сильно испортить ваш первый опыт взаимодействия с нейросетями.
Итак, чат-бот работает на основе заложенных в него алгоритмов. Если вы попробуете «пообщаться» с нейросетью как с реальным собеседником, то, вероятнее всего, она вас не поймет или выдаст некорректный результат. Чтобы получить то, что нужно, выполняйте наши рекомендации. Они пригодны и для других аналогичных нейронных сетей.
Несмотря на то, что чат-бот официально недоступен в России, не упомянуть его нельзя – это самая популярная и одна из наиболее развитых нейросетей на сегодняшний день. В мае 2024 года была представлена последняя публично доступная версия модели – GPT-4o (где «o» значит «omni»). Новинка способна в режиме реального времени анализировать все основные виды данных – текст, аудио, изображения, видео и комбинации из них – и генерировать в ответ текст, аудио, изображения и комбинации из них. Чат-бот способен реагировать на входящие аудиозапросы со скоростью 232–320 мс, что сопоставимо с реакцией среднестатистического человека в процессе обычной беседы. Что касается текстового режима работы, то производительность GPT-4o соответствует GPT-4 Turbo на английском языке и языках программирования, однако с другими языками, доступными в модели, новая версия стала работать гораздо быстрее. Кроме того, ChatGPT-4o лучше «видит» и «слышит» в сравнении с предыдущими моделями. Средняя задержка в голосовом режиме общения с чат-ботом версии GPT-3.5 составляла 2,8 с, а с GPT-4 – 5,4 с. Такая высокая задержка в предыдущих версиях нейросети связана с тем, что ранее голосовой режим ввода функционировал с использованием трех отдельных моделей, работавших в виде конвейера. А в GPT-4o реализована единая модель сквозного анализа и обучения с помощью разных типов данных. Разработчики признают, что это первая модель компании OpenAI, в которой используется подобный подход, в связи с чем они изучают ее возможности и ограничения вместе с пользователями. Новая модель может напрямую оценивать тон собеседника, его эмоции, определять фоновые шумы и многое другое, поддерживает множество языков запросов, в том числе русский. А также может генерировать тексты на разные темы, поддерживать беседы, писать стихи, решать математические задачи, анализировать, исправлять и писать с нуля код на языках программирования, петь и т. д. Помимо технологических достижений, OpenAI обещает делать все возможное для того, чтобы ее модель была доступна как можно большему числу заинтересованных пользователей по всему миру, к тому же на бесплатной основе. В этом определенно есть доля лукавства, так как чат-бот ChatGPT доступен не во всех странах. Да и лимиты на запросы в бесплатной версии не сильно впечатляют: их количество зависит от загрузки серверов компании в конкретный момент времени, а так как сейчас наблюдается ажиотаж, то рассчитывать на существенные квоты не стоит.
Также без регистрации недоступно сохранение истории чатов, голосовой ввод, поиск в интернете, загрузка файлов, анализ данных и генерация картинок в Dall-E 3. OpenAI также предупреждает, что по умолчанию будет обучать нейросеть на ваших данных. Это можно отключить в настройках только после регистрации.
GPT-o1 — модель OpenAI, которая умеет «размышлять». Она тратит время на «подумать» перед тем, как дать ответ. Из-за этого результаты генерации получаются более качественными. Ход мыслей нейросети можно посмотреть. Это нужно в первую очередь для того, чтобы решать сложные математические и научные задачи. У нее есть лимиты — 50 запросов в день.
Принципы работы с подавляющим большинством чат-ботов довольно просты. Взаимодействие с ними осуществляется в рамках непосредственного диалога, во многом похожего на беседу людей в реальном мире. Некоторые нейросети воспринимают запросы к себе в свободной форме, другие требуют соблюдения некоторых правил, в том числе грамматических. Самое главное, что требуется от пользователя при общении с любой нейросетью, – четкое понимание, что необходимо получить в результате совместной работы. Обычно необходимо определиться с целевым контентом, с тем чтобы правильно выбрать соответствующий инструмент. Дело в том, что универсальных нейросетей не так много, тогда как большинство ИИ-инструментов заточены под определенный тип данных (текст, изображения, видео, аудио и т. п.). Далее очень важно указать максимальное число деталей, которые могут описывать желаемый результат, – это может быть цветовая палитра и/или стиль, которому должен соответствовать контент. Например, можно попросить нейросеть подготовить рассказ о черных дырах в научно-популярном стиле или нарисовать (а точнее сказать, «сгенерировать») закат на море в стиле импрессионистов. Отдельно можно задать нюансы подачи текстовой или визуальной информации. Например, попросить раскрыть тему, не упоминая определенные ее аспекты. И, пожалуй, самая главная особенность рабочего процесса с чат-ботом – последовательная доработка контента. То есть если пользователь недоволен промежуточным результатом, он продолжает уточнять запросы для нейросети до тех пор, пока не добьется нужного исхода. В связи с этим в Сети появилось немало мемов, так как нейросети иногда упорно отказываются выполнять какие-либо действия либо выполняют их очень своеобразно, что приводит к нелепым или смешным результатам. Что касается работы с отдельными плагинами (например, для интернет-браузеров), в которые встроены некоторые функции нейросетей, то здесь принципы взаимодействия плюс-минус те же, однако с поправкой на особенности конкретного приложения.
Проект «Шедеврум» – это приложение компании «Яндекс», способное генерировать изображения и видео по текстовому описанию. Работает на основе генеративных нейросетевых моделей YandexART и YandexGPT. В ленте «Шедеврума» версия сервиса сейчас отображается как v.1.3. Язык интерфейса – русский. Понимает запросы на русском, английском и казахском языках. Интересное отличие от ряда конкурирующих продуктов заключается в том, что «Шедеврум» – это не только чат-бот, но и простейшая социальная сеть, где люди выкладывают результаты своих запросов и оценивают их. Для создания изображений в YandexART использует метод каскадной диффузии. Чтобы обучить такую модель, изображения специально сильно искажают с помощью шумовых визуальных эффектов, после чего просят модель восстановить исходное состояние. Нейросеть обучена на 330 млн изображений, сопровождаемых подробными текстовыми описаниями, благодаря чему может генерировать даже такие, которых изначально «не знала». Основной способ взаимодействия для простых пользователей – мобильное приложение «Шедеврум» от «Яндекса», в котором нужно авторизоваться с помощью «Яндекс ID». Компаниям лучше получить доступ к YandexART с помощью платформы Yandex Cloud в рамках сервиса Foundation Models . Для автоматизации бизнес-процессов, конечно, существует возможность интеграции через API, а в режиме интерфейса Playground в консоли управления Yandex Cloud можно протестировать возможности нейросетей в деморежиме. В то же время даже в пробной версии пользователи могут генерировать неограниченное количество изображений бесплатно. Пока что нейросеть готова генерировать новый контент только в ответ на текстовые запросы. Нарисовать картинку по фото не получится. Если есть сложности с запросом, вам на помощь придёт бот. Просто нажмите на кнопку со знаком плюс, и вам предложат несколько модификаторов на выбор. Ещё одна подсказка — лента. В ней публикуются все изображения пользователей и описания к ним.
Писать запросы в одном и том же окне можно, но нейросеть будет путаться, что плохо скажется на качестве ответов. Поэтому открывайте новый чат для каждой темы и «беседуйте» с ботом только там. Нейросеть «запоминает» течение диалога, и если вся информация находится в одном месте, то она лучше понимает, что нужно сделать. По этой же причине нужно каждый раз начинать «беседу» заново, если ответ не подходит.
Грамотно и четко формируйте промпты
Правда, понимание вопросов и уровень ответов отличаются в разных случаях. Корректнее всего нейронная сеть работает на английском, так как сначала ее обучили работе именно на англоязычном контенте. На русском языке ChatGPT действует несколько хуже. Правда, проблема устраняется при переходе на платный тариф.
Простой пример: вам нужно сгенерировать статью. Вы написали нейросети, что хотите получить, на какую тему будет контент, но не указали нужный объем и необходимость структурировать материал. Чат-бот выдаст вам либо небольшой текст, либо слишком объемный, а возможно, одним полотном.
Такую возможность хорошо использовать для сохранения и выделения основных моментов диалога. Так, можно записать общение по телефону на диктофон, перевести аудиозапись в текст через бесплатный инструмент Whisper JAX, вставить текстовый материал по частям в нейронную сеть и попросить ее выделить основные моменты.
Если вы не дали чат-боту исчерпывающую информацию, то и ответ будет неточным. В таком случае, нейросеть «придумает» неизвестные данные самостоятельно и, скорее всего, выдаст некорректный результат. Задавать уточняющие вопросы ChatGPT вряд ли будет, хотя он умеет это делать.
Доступ к Dall-E 3 для генерации картинок. В чате можно попросить не только сделать что-то с текстом, но и нарисовать картинку. Графическая нейросеть отлично понимает запросы на естественном языке, сама превращает идею пользователя в подробный промпт и генерирует изображения — от логотипов до комиксов.
GigaChat – это русскоязычная мультимодальная нейросетевая модель, способная вести диалог, отвечать на вопросы, подготавливать тексты и формировать изображения по запросу. Для доступа к GigaChat необходимо посетить официальный сайт чат-бота либо запустить его в Telegram или «ВКонтакте». Ситуация с доступом к нейросети противоположная ChatGPT: если там нужен зарубежный IP, то для доступа к GigaChat от «Сбера», наоборот, необходим российский IP, а авторизация осуществляется через «Сбер ID». Если вы пользуетесь «Сбербанком Онлайн», то «Сбер ID» – это номер вашего телефона. В России GigaChat функционирует без ограничений. Как и ChatGPT, он отлично подходит для интеграции в сторонние чат-боты и сервисы. Запросы также можно осуществлять на разных языках. Для личного использования нейросеть предоставляется бесплатно (freemium-режим). Речь идет об 1 млн токенов (единицы информации, на которые делятся запросы) без дополнительной платы ежегодно: 950 000 токенов для GigaChat Lite и 50 000 токенов – для GigaChat Pro. Если токены закончились, их можно докупить. Для бизнеса чат-бот платный: минимальная стоимость – 600 рублей в месяц при 0,2 рубля за 1000 токенов. В GigaChat используется совокупность нейросетевых моделей, которую разработчики назвали NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Изначально использовалась модель ruGPT-3 размером 13B (то есть с 13 млрд параметров), обученная на корпусе данных в 300 Гбайт (книги, новостные заметки на русском и английском языках, научные статьи и т. п.). Потом использовались ruGPT-3.5 и FRED-T5. В настоящее время ядром чат-бота GigaChat является GigaChat версии 29В (29 млрд параметров). Для работы с изображениями используется отдельная модель «Кандинский» версии 3.1 (Kandinsky 3.1). Как и в случае с другими нейросетями, при работе с GigaChat особое значение имеет грамотно составленный запрос (промпт). Кстати, не стоит забывать, что нейросети могут отвечать похожими фразами на одни и те же вопросы, но каждый раз ответы будут хотя бы немного различаться, так как генерируются заново.
Используйте готовые запросы
Для увеличения количества запросов к чат-боту на аккаунте придется подключить подписку. Ее стоимость составляет от 5 до 59 долларов за 50 сообщений в день (зависит от того, на какой период приобретается подписка). За регистрацию пользователей по партнерской ссылке дают бонусы, которые можно тратить на дополнительные запросы.
Еще совсем недавно от западных облачных сервисов зависело 30% крупных российских компаний. Их отключение, порой внезапное, должно было поставить рынок перед сложными вызовами. Но оказалось, что российские облака готовы предложить рынку вполне зрелые решения. Это и многое другое обсудили участники круглого стола IT-World «Импортозамещение в облаках».
Шаг 2. Выберите, как будете регистрироваться — по электронной почте или через учетные записи Google, Microsoft или Apple. Со вторым вариантом могут возникнуть проблемы, если аккаунты зарегистрированы в российском регионе. Поэтому выберем первый.
Так что вот основной совет: пользуйтесь ботами, которым доверяете. Например, их сделали ваши знакомые или хорошо зарекомендовавшие себя компании. Еще не забудьте, что бот с ChatGPT — платная услуга для разработчика. Так что в какой-то момент с вас могут попросить плату. Тут тем более не стоит отдавать деньги тем, кому вы не можете доверять на 100%.
Доступ к режиму GPT-4o with сanvas. Он предназначен для работы с текстом и кодом. Это полноценный редактор, в котором экран поделен на две части. С одной стороны — окно с результатами генерации, с другой — чат с нейросетью. Так удобнее вносить правки и редактировать контент.
Про нейросеть Kandinsky 3.1 от «Сбера» мы уже говорили, однако она заслуживает отдельного от многофункционального чат-бота GigaChat упоминания. Впервые эта генеративная модель появилась в конце 2021 года под названием ruDALL-E XL, она способна создавать изображения по тексту, новые изображения на основе загружаемых в нее, дополнять готовые изображения новыми деталями, смешивать одно с другим, а также создавать небольшие видеоролики. Видеофункции – пока что самое слабое ее место: генерируются долго, а их качество оставляет желать лучшего. Что касается статических изображений, то некоторые пользователи считают эту нейросеть достойным конкурентом Midjourney и Stable Diffusion. Доступные языки запросов – русский и английский. Пользователям доступно неограниченное количество изображений в бесплатном режиме. Чтобы узнать актуальные способы доступа, рекомендуем посетить официальный сайт нейросети Kandinsky (раздел веб-портала «Сбера»), там всегда выложены все рабочие в данный момент варианты. Впрочем, для большинства потенциальных пользователей основным способом попробовать модель в действии остается портал Fusion Brain , созданный командой Института искусственного интеллекта (AIRI). Первой и пока единственной нейросетью, к которой организован доступ на портале, является Kandinsky: удобный и интуитивно понятный интерфейс, простая регистрация с помощью адреса электронной почты. Также доступ к нейросети можно получить с помощью ботов в социальной сети «ВКонтакте» и мессенджере Telegram. Кроме того, существует отдельный Telegram-бот исключительно для генерации видео, однако доступ к нему предоставляется только после рассмотрения предварительной заявки. По умолчанию везде используется новейшая модель нейросети версии 3.1, однако в ботах при желании можно переключиться на предыдущие версии 2.2 и 2.1.
Нейросетевые инструменты с каждым днем приобретают всё бóльшую популярность как среди профессионалов, так и у широкой аудитории интересующихся. На самом деле конечный продукт, который известен большинству обывателей под названием «нейросеть», представляет собой связку из чат-бота, самообучающейся большой языковой модели и генеративного искусственного интеллекта. Именно большая языковая модель является той самой нейронной сетью с огромным количеством разных параметров, которую обучают либо она самообучается (возможны оба варианта) с помощью анализа огромных массивов данных разных категорий. В свою очередь с помощью больших языковых моделей функционирует так называемый генеративный искусственный интеллект, который по запросу пользователей генерирует разнообразный новый контент: в зависимости от специализации нейросети это может быть текст, программный код, изображения, видео и многое другое. Чат-боты выступают в качестве интерфейсов, с помощью которых пользователи взаимодействуют с конкретными нейросетями. Чаще всего архитектура современных больших языковых моделей определяется как трансформер (тип организации глубоких нейронных сетей). Даже ChatGPT – самый популярный чат-бот на планете – расшифровывается как «генеративный предварительно обученный трансформер» (англ. Generative Pre-trained Transformer). По поводу корректности всех перечисленных терминов продолжаются споры, поэтому для простоты будем называть описываемые в статье продукты нейросетями или чат-ботами. Последние версии чат-ботов имеют достаточно широкое прикладное применение. Они могут выступать в роли ИИ-ассистентов, имитировать дружеское общение, развлекать, помогать в изучении языков и научных дисциплин, осуществлять синхронный перевод в процессе общения носителей разных языков, помогать в решении рабочих задач, давать развернутые ответы на вопросы, спектр которых ограничен лишь фантазией вопрошающих, создавать, интерпретировать и творчески дорабатывать различный контент – как текстовый, так и графический. С помощью дополнительных плагинов можно, например, автоматически превратить аудиозапись телефонного разговора в текст и даже попросить чат-бота самостоятельно определить ключевые пункты общения. В качестве ИИ-помощника чат-боты способны взять на себя организацию вашего ежедневного распорядка, в том числе рабочих задач. Кроме того, с помощью нейросетей можно получать подсказки в процессе решения научных и прикладных задач – математических, физических, в области программирования и т. д.: например, как улучшить конкретный программный код или даже полностью переписать его с одного языка программирования на другой. А с помощью соответствующих запросов к одному чат-боту можно научиться правильно формулировать их для других нейросетей. В теории деятельность нейросетей не ограничена ничем, кроме текущего законодательства и норм морали в том объеме, в котором их исповедуют разработчики конкретных чат-ботов. В связи с этим наиболее сложной темой в сегменте регулирования нейросетей до сих пор остается авторское право. Несмотря на то, что чисто номинально нейросети не могут создавать контент, нарушающий авторские права или непосредственно использующий чью-либо личную информацию, на деле все нейросетевые алгоритмы обучаются на данных, защищенных авторскими правами: это книги, журналы, картины и т. д. То есть, чтобы научиться писать качественные тексты, нейросети буквально штудируют классическую и современную литературу, а чтобы генерировать радующие глаз изображения, бесконечно анализируют работы всемирно признанных художников. Некоторые представители творческих профессий возражают против этого, однако до принятия решения, которое устроит все стороны конфликта, пока далеко. Стоит также отметить, что некоторые популярные нейросети (ChatGPT, Gemini, Copilot (Bing AI), Midjourney и др.) официально не работают в России, поэтому воспользоваться ими можно лишь с территории других государств. Чтобы получить доступ даже к бесплатным наборам функций некоторых чат-ботов для успешной регистрации в сервисе, нужен не только иностранный IP, но и зарубежный телефонный номер, а для оплаты дополнительных функций понадобится международная банковская карта. Тем не менее не стоит сильно огорчаться, ведь некоторые функции этих инструментов встроены в другие продукты, доступные в России (правда, не всегда речь идет о полноценном доступе). Кроме того, многие российские компании разрабатывают собственные нейросети различных категорий – речь идет как о продукции крупных корпораций вроде «Сбера» и «Яндекса», так и о частных инициативах разработчиков.
Тем не менее регистрация в версии ChatGPT-4o действительно стала проще – больше не требуется зарубежный номер телефона (как было в предыдущей версии), достаточно воспользоваться любой электронной почтой или сервисом быстрой авторизации от Google, Microsoft и Apple. Однако OpenAI, как и прежде, ограничивает возможность регистрации с российских IP-адресов. Если для регистрации аккаунта в ChatGPT вы не желаете или не можете временно изменить свою геолокацию, то чат-бота можно протестировать с помощью посреднических сервисов, например LMSYS Chatbot Arena . В разделе Direct Chat можно из списка выбрать нужную модель, в том числе ChatGPT-4o, и отправить запрос. Однако проблема чрезвычайно малого числа бесплатных запросов на сервисах посредников ощущается еще сильнее. Кстати, судя по всему, до релиза ChatGPT-5 осталось совсем немного.