Содержание статьи
Нейросети, доступные в России: как подключиться и использовать
GigaChat
Проект «Шедеврум» – это приложение компании «Яндекс», способное генерировать изображения и видео по текстовому описанию. Работает на основе генеративных нейросетевых моделей YandexART и YandexGPT. В ленте «Шедеврума» версия сервиса сейчас отображается как v.1.3. Язык интерфейса – русский. Понимает запросы на русском, английском и казахском языках. Интересное отличие от ряда конкурирующих продуктов заключается в том, что «Шедеврум» – это не только чат-бот, но и простейшая социальная сеть, где люди выкладывают результаты своих запросов и оценивают их. Для создания изображений в YandexART использует метод каскадной диффузии. Чтобы обучить такую модель, изображения специально сильно искажают с помощью шумовых визуальных эффектов, после чего просят модель восстановить исходное состояние. Нейросеть обучена на 330 млн изображений, сопровождаемых подробными текстовыми описаниями, благодаря чему может генерировать даже такие, которых изначально «не знала». Основной способ взаимодействия для простых пользователей – мобильное приложение «Шедеврум» от «Яндекса», в котором нужно авторизоваться с помощью «Яндекс ID». Компаниям лучше получить доступ к YandexART с помощью платформы Yandex Cloud в рамках сервиса Foundation Models . Для автоматизации бизнес-процессов, конечно, существует возможность интеграции через API, а в режиме интерфейса Playground в консоли управления Yandex Cloud можно протестировать возможности нейросетей в деморежиме. В то же время даже в пробной версии пользователи могут генерировать неограниченное количество изображений бесплатно. Пока что нейросеть готова генерировать новый контент только в ответ на текстовые запросы. Нарисовать картинку по фото не получится. Если есть сложности с запросом, вам на помощь придёт бот. Просто нажмите на кнопку со знаком плюс, и вам предложат несколько модификаторов на выбор. Ещё одна подсказка — лента. В ней публикуются все изображения пользователей и описания к ним.
Шаг 2. Узнать как можно больше о применении искусственного интеллекта в нужной сфере. В интернете много информации об этих технологиях, поэтому можно изучать без посторонней помощи. Но этот процесс длинный, поэтому лучше обратиться в компанию, которая разрабатывает продукцию на основе искусственного интеллекта. Например, в Томору делают умных голосовых роботов и чат-ботов, которые помогают менеджерам с обзвонами и приглашениями на вебинары, а эйчарам — отбирать соискателей.
Шаг 1. Выделить проблемы, которые должна решить программа с искусственным интеллектом. Например, в компании менеджеры не успевают доводить теплых клиентов до договоров, потому что тратят время на обзвон по холодной базе, с этим могут помочь умные голосовые роботы, которые разговаривают как люди. А если бухгалтерия не справляется с текущими документами, ей поможет умный алгоритм, который возьмет рутину на себя.
Еще совсем недавно от западных облачных сервисов зависело 30% крупных российских компаний. Их отключение, порой внезапное, должно было поставить рынок перед сложными вызовами. Но оказалось, что российские облака готовы предложить рынку вполне зрелые решения. Это и многое другое обсудили участники круглого стола IT-World «Импортозамещение в облаках».
Также бот может проверить знания сотрудников после обучения. Например, каждый сотрудник должен ответить на вопросы, по ответам руководство видит, как и кто учился. Если у кого-то слабые знания, возможно, человеку сложно дается это направление, и он силен в другом.
В портфолио генеративных моделей «Яндекса» сейчас наиболее актуальна серия YandexGPT 3 . Компания позиционирует ее как качественный вспомогательный инструмент для использования в ИТ-продуктах и решения бизнес-задач широкого спектра. Первенец этой серии – YandexGPT 3 Pro – доступен в сервисе Yandex Cloud. Как обычно, новая версия лучше справляется с пониманием запросов и решением поставленных задач. Согласно оценкам с помощью методики YaMMLU_ru, процент верных ответов чат-бота при запросах на русском языке вырос с 55% в YandexGPT 2 до 63% в YandexGPT 3. Аналогичные показатели у Llama-2 70B и ChatGPT-3.5 Turbo по той же методике составляют 59% и 58% соответственно. То есть на русском языке новая версия справляется лучше зарубежных аналогов. Однако не нужно забывать, что нейросети все еще ошибаются, (это касается не только YandexGPT 3, но и всех остальных чат-ботов). Тем не менее количество фактических ошибок в YandexGPT 3 снизилось до 13,5%, что на 2,9% меньше, чем в предыдущей версии этой большой языковой модели, а в категории «неподтвержденная информация» упало с 6,4% до 5%. Помимо некоторых преимуществ работы YandexGPT 3 на русском языке (в сравнении с зарубежными аналогами), разработчики утверждают, что новая версия превосходит ChatGPT-3.5 Turbo в вопросах, затрагивающих узкие классы бизнес-задач. Для достижения этого ее дополнительно обучали на задачах, возникающих в специфических рабочих процессах. В «Яндексе» полагают, что их сервис будет полезен менеджерам продуктов, разработчикам, директорам по данным (CDO) в самых разных областях экономики (финтех, ретейл, промышленность и т. д.). Для того, чтобы начать работать с YandexGPT API, необходимо пройти аутентификацию в Yandex Foundation Models . Обычные пользователи могут попробовать работу в двух деморежимах на выбор – чат или промт, достаточно авторизоваться с помощью «Яндекс ID». Для тестирования бизнес-задач нужно перейти в режим Playground (интерфейс в консоли Yandex Cloud).
Шедеврум
Робот может рассказать о вакансии, зарплате и графике работы, ответить на вопросы и передать эту информацию эйчару. Например, в Томору робот с искусственным интеллектом занимается первичным отбором соискателей. Чтобы выбрать из тысячи резюме подходящие, специалист отдела кадров тратит на просмотр каждого две-три минуты. Получается, что на первом этапе отбора резюме работник тратит тридцать три часа, или четыре рабочих дня. В это время он не может заниматься другими делами, кроме как просматривать резюме. Робот на такую работу тратит пять минут.
Шаг 4. Найти компанию, которая разработает программу и запустит алгоритм на пробный период. Лучше запустить минимально готовый продукт — версию программы, когда она способна выполнять основные функции, но еще требует доработки, — и посмотреть, как она работает, что не так, что можно поменять. Это легче, чем потом переделывать готовый продукт, и дешевле, потому что не придется вкладывать сразу полную сумму.
На самом деле количество доступных в России нейросетей гораздо больше. Мы не упомянули, например, Craiyon, Dream, Colorize, Starryai, CopyMonkey, Turbotext, Wordify, Notion AI и многие другие. Однако нужно понимать, что далеко не всегда это полноценные нейросети, такие же, как описаны выше, – нередко речь идет лишь о плагинах, воплощающих отдельные функции. Например, Colorize – это AI-сервис, который раскрашивает черно-белые фото и видео в натуральные цвета. Очевидно, что это хотя и полезный, но узкоспециальный инструмент. Кроме того, многие ИИ-продукты и плагины, доступные сегодня на рынке и работающие с текстом и кодом, основаны на базе разных версий ChatGPT или других известных моделей. На самом деле в этом нет ничего плохого – наоборот, отдельные энтузиасты, создавая узкоспециализированные приложения, последовательно развивают возможности неройсетевых моделей в различных направлениях до экспертных. Отдельно хотелось бы отметить сегмент обучающих нейросетей, например Character AI, Perplexity, Socratic и многие другие. В основном это разновидности ИИ-ассистентов, способных помогать учащимся в решении задач (физика, химия, математика и т.д.), освоении программирования и улучшении определенных навыков (например, восприятия иностранной речи на слух или произношения). Мы осознанно почти не затрагивали технические особенности создания и обучения больших языковых моделей, потому что их можно обсуждать так же долго, как достоинства и недостатки каждой из них. Одно неоспоримо: умение взаимодействовать с нейросетями, в частности грамотно строить запросы и хотя бы на минимальном уровне понимать, как они работают, де-факто уже стало обязательным. Поэтому, если вы еще не шагнули в мир нейросетевых технологий, самое время попробовать.
Анализировать продажи и покупательскую способность — искусственный интеллект может собирать отчеты на основе покупательской активности. Затем по этим данным прогнозировать спрос на определенную продукцию: например, зимой люди чаще заказывают горячие напитки и еду с доставкой в офис, а летом берут прохладный кофе, салаты и заходят лично, потому что приятно прогуляться. Руководство кафе решает расширять меню с учетом этих данных.
Обучать сотрудников, например, с помощью чат-бота с искусственным интеллектом. Когда в компанию приходят новые сотрудники, им нужно объяснять, как заполнять документы, к кому и по каким вопросам обращаться. Необязательно отвлекать на это дело менеджеров или работников кадрового дела, можно создать чат-бот, в котором закрепить сообщения с инструкциями. Если у нового сотрудника возникнут вопросы, он спросит бота, а не будет отвлекать менеджера от работы.
GigaChat – это русскоязычная мультимодальная нейросетевая модель, способная вести диалог, отвечать на вопросы, подготавливать тексты и формировать изображения по запросу. Для доступа к GigaChat необходимо посетить официальный сайт чат-бота либо запустить его в Telegram или «ВКонтакте». Ситуация с доступом к нейросети противоположная ChatGPT: если там нужен зарубежный IP, то для доступа к GigaChat от «Сбера», наоборот, необходим российский IP, а авторизация осуществляется через «Сбер ID». Если вы пользуетесь «Сбербанком Онлайн», то «Сбер ID» – это номер вашего телефона. В России GigaChat функционирует без ограничений. Как и ChatGPT, он отлично подходит для интеграции в сторонние чат-боты и сервисы. Запросы также можно осуществлять на разных языках. Для личного использования нейросеть предоставляется бесплатно (freemium-режим). Речь идет об 1 млн токенов (единицы информации, на которые делятся запросы) без дополнительной платы ежегодно: 950 000 токенов для GigaChat Lite и 50 000 токенов – для GigaChat Pro. Если токены закончились, их можно докупить. Для бизнеса чат-бот платный: минимальная стоимость – 600 рублей в месяц при 0,2 рубля за 1000 токенов. В GigaChat используется совокупность нейросетевых моделей, которую разработчики назвали NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Изначально использовалась модель ruGPT-3 размером 13B (то есть с 13 млрд параметров), обученная на корпусе данных в 300 Гбайт (книги, новостные заметки на русском и английском языках, научные статьи и т. п.). Потом использовались ruGPT-3.5 и FRED-T5. В настоящее время ядром чат-бота GigaChat является GigaChat версии 29В (29 млрд параметров). Для работы с изображениями используется отдельная модель «Кандинский» версии 3.1 (Kandinsky 3.1). Как и в случае с другими нейросетями, при работе с GigaChat особое значение имеет грамотно составленный запрос (промпт). Кстати, не стоит забывать, что нейросети могут отвечать похожими фразами на одни и те же вопросы, но каждый раз ответы будут хотя бы немного различаться, так как генерируются заново.
Нанимать сотрудников — искусственный интеллект помогает компании удешевить наем работников. Программа в виде чат-бота или голосового робота созванивается с соискателем, чтобы узнавать, ищет ли он еще работу, тестировать и отвечать на вопросы. Например, в компании «Томору» процесс найма длинный: соискатель общается с роботом, который оснащен искусственным интеллектом, затем с чат-ботом, потом проходит тесты по математике, логике и личным особенностям. Если пройдет все этапы, то встречается с эйчаром и проходит обучение.
Прежде чем внедрять ИИ в бизнес, нужно разобраться, какие проблемы компании должна решать программа и в каком виде нужно подключать искусственный интеллект: чат-бот, нейросеть, голосовой робот или робот для логистики или анализа данных. Вот несколько шагов, которые помогут внедрить новые технологии в бизнес.