Содержание статьи
Нейросеть ChatGPT: что это, как пользоваться и получить доступ в России
Как зарегистрироваться в ChatGPT из России?
Думаем, что наша аудитория в большей степени знакома с ChatGPT, чем люди из исследования выше — в основном, нас читают digital-специалисты. Но мало кто знает, как устроена ChatGPT и мало кто знаком с историей ее развития. Мы решили провести ликбез — понимание принципов работы нейросети на фундаментальном уровне поможет использовать ее более эффективно.
Через год после того, как Google Brain обнародовали архитектуру «Трансформер», OpenAI выпустили статью «Improving Language Understanding by Generative Pre-Training» и первую версию своей языковой модели — GPT-1. Первая версия модели не была в публичном доступе — это была внутренняя разработка OpenAI. GPT-1 стала примером инновационного подхода OpenAI к машинному обучению — методу генеративного предварительного обучения.
По сути, ChatGPT — это интерфейс в виде чат-бота, который служит «прокладкой» между пользователем и языковой моделью GPT. Платная версия продукта работает на языковой модели GPT-4, а бесплатная — на GPT-3.5. Для понимания принципа работы нейросети объясним, как устроены языковые модели семейства GPT.
Здесь мы наблюдаем за формированием запроса для генерации нейросети Midjourney. Автор поста запросил придумать интересный и фантастический декор гостиной для дизайн-проекта. В ответ на это бот подготовил три варианта благоустройства комнаты, а пользователь в дальнейшем вбил текст в Midjourney и получил подходящие изображения высокого качества. Отличная командная работа!
За счет дообучения нейросеть стала более подготовленной к использованию простыми людьми, которые не являются промпт-инженерами, а просто пишут незамысловатые запросы. Ее мощности остались примерно теми же, что и в версии GPT-3. При этом, открытый публичный доступ, удобный интерфейс и невероятные доселе возможности сделали ChatGPT всемирно известной.
Версия GPT-2 вышла в феврале 2019 года — это была первая публичная версия языковой модели. GPT-2 была результатом масштабирования языковой модели GPT-1. Фундаментально ее архитектура не изменилась — разве что увеличили количество слоев до 48 и загрузили в нее 40 Гб данных, за счет чего ее количество параметров увеличилось в 10 раз. Благодаря этому нейросеть сама научилась отвечать на вопросы, генерировать достаточно сложные эссе и переводить тексты с языка на язык с переменным успехом.
Как устроена языковая модель GPT
В чем преимущество архитектуры «Трансформер»: нейросеть на ее базе состоит из отдельных слоев, которые работают параллельно, а также позволяют улавливать контекст и долгосрочные зависимости в запросе. В случае с языковыми моделями это означает, что нейросеть генерирует следующее слово на основе всех предыдущих слов из запроса и связей между ними. Менее продвинутая T9 предлагает следующее слово лишь на основе одного предыдущего слова — дело в более примитивной архитектуре.
Бета-версия GPT-3 вышла в июне 2020 года. В нее загрузили еще больше данных, за счет чего количество параметров нейросети снова увеличилось в 10 раз в сравнении с предыдущей версией. С апгрейдом у нейросети появилось еще больше навыков. Она стала еще лучше работать с текстом, научившись выдавать более сложные ответы в разной стилистике, а также писать программный код и проводить несложные математические вычисления.
Выглядит GPT Chat bot как простое диалоговое окно, с которым может справиться каждый. В будущем планируется изменить вид бота в виде интерфейса прикладного программирования ради увеличения функционала для разработчиков. GPT чат нейросеть находится в бесплатном доступе, и для работы с ней достаточно зарегистрироваться на сайте OpenAI. И в то же время у российских пользователей появятся проблемы: сайт блокирует наши IP-адреса и телефонные номера, но эта проблема решаема, мы обсудим это позже.
Эта версия языковой модели доступна в 2 видах: в платной подписке ChatGPT Plus, а также в чат-боте браузера Bing от Microsoft. О том, как пользоваться обновленной версией ChatGPT в Bing, мы рассказали в статье «Обзор ChatGPT: что умеет и как эффективно пользоваться нейросетью». Новая модель нейросети появилась у Microsoft, потому что компания Билла Гейтса проинвестировала в OpenAI более 10 миллиардов долларов.
Революция наступила, когда появилась языковая модель InstructGPT, она же GPT-3.5, которая и стала основой ChatGPT. Ключевое отличие InstructGPT от GPT-3 в том, что ее более глубоко дообучали люди, оценивая качество ответов. Еще ее максимальное количество токенов увеличилось до 4 096.
Блочное устройство «Трансформера» позволило сильно масштабировать нейросети, скармливая им огромное количество данных, не вызывая при этом неадекватных требований к вычислительным мощностям. Поэтому после обновлений тексты GPT становятся все более похожими на человеческие. С ростом количества алгоритмов нейросети ее ответы все чаще становятся дельными советами.
Нейросети семейства GPT работают на базе архитектуры глубоких нейронных сетей, которая называется «Трансформер». Эту архитектуру изобрели в 2017 году в Google Brain — исследовательской группе Google, которая занимается изучением и разработкой нейросетей. Создание архитектуры «Трансформер» стало переломным моментом в проектировании нейросетей и позволило создать настолько «умный» продукт, как ChatGPT.
Еще немаловажный фактор уникальности — избегание сомнительных тем: чат не имеет расы, пола, предпочтений в политике и религии. Фильтры бота блокируют инструкции и обсуждение аморальных и противозаконных действий, поэтому вряд ли пользователь сможет узнать, каким образом у него получится нарушить закон и остаться непойманным.