Как подключиться к искусственному интеллекту

0
14

Как подключиться к искусственному интеллекту

Как с ними работать?

Нанимать сотрудников — искусственный интеллект помогает компании удешевить наем работников. Программа в виде чат-бота или голосового робота созванивается с соискателем, чтобы узнавать, ищет ли он еще работу, тестировать и отвечать на вопросы. Например, в компании «Томору» процесс найма длинный: соискатель общается с роботом, который оснащен искусственным интеллектом, затем с чат-ботом, потом проходит тесты по математике, логике и личным особенностям. Если пройдет все этапы, то встречается с эйчаром и проходит обучение.

Робот может рассказать о вакансии, зарплате и графике работы, ответить на вопросы и передать эту информацию эйчару. Например, в Томору робот с искусственным интеллектом занимается первичным отбором соискателей. Чтобы выбрать из тысячи резюме подходящие, специалист отдела кадров тратит на просмотр каждого две-три минуты. Получается, что на первом этапе отбора резюме работник тратит тридцать три часа, или четыре рабочих дня. В это время он не может заниматься другими делами, кроме как просматривать резюме. Робот на такую работу тратит пять минут.

Также бот может проверить знания сотрудников после обучения. Например, каждый сотрудник должен ответить на вопросы, по ответам руководство видит, как и кто учился. Если у кого-то слабые знания, возможно, человеку сложно дается это направление, и он силен в другом.

Проект «Шедеврум» – это приложение компании «Яндекс», способное генерировать изображения и видео по текстовому описанию. Работает на основе генеративных нейросетевых моделей YandexART и YandexGPT. В ленте «Шедеврума» версия сервиса сейчас отображается как v.1.3. Язык интерфейса – русский. Понимает запросы на русском, английском и казахском языках. Интересное отличие от ряда конкурирующих продуктов заключается в том, что «Шедеврум» – это не только чат-бот, но и простейшая социальная сеть, где люди выкладывают результаты своих запросов и оценивают их. Для создания изображений в YandexART использует метод каскадной диффузии. Чтобы обучить такую модель, изображения специально сильно искажают с помощью шумовых визуальных эффектов, после чего просят модель восстановить исходное состояние. Нейросеть обучена на 330 млн изображений, сопровождаемых подробными текстовыми описаниями, благодаря чему может генерировать даже такие, которых изначально «не знала». Основной способ взаимодействия для простых пользователей – мобильное приложение «Шедеврум» от «Яндекса», в котором нужно авторизоваться с помощью «Яндекс ID». Компаниям лучше получить доступ к YandexART с помощью платформы Yandex Cloud в рамках сервиса Foundation Models . Для автоматизации бизнес-процессов, конечно, существует возможность интеграции через API, а в режиме интерфейса Playground в консоли управления Yandex Cloud можно протестировать возможности нейросетей в деморежиме. В то же время даже в пробной версии пользователи могут генерировать неограниченное количество изображений бесплатно. Пока что нейросеть готова генерировать новый контент только в ответ на текстовые запросы. Нарисовать картинку по фото не получится. Если есть сложности с запросом, вам на помощь придёт бот. Просто нажмите на кнопку со знаком плюс, и вам предложат несколько модификаторов на выбор. Ещё одна подсказка — лента. В ней публикуются все изображения пользователей и описания к ним.

Шаг 4. Найти компанию, которая разработает программу и запустит алгоритм на пробный период. Лучше запустить минимально готовый продукт — версию программы, когда она способна выполнять основные функции, но еще требует доработки, — и посмотреть, как она работает, что не так, что можно поменять. Это легче, чем потом переделывать готовый продукт, и дешевле, потому что не придется вкладывать сразу полную сумму.

Для внедрения новых программ и алгоритмов с искусственным интеллектом понадобятся мощные компьютеры и дополнительные программы. Например, голосовой робот обзванивает клиентов по холодной базе, и чтобы записать все данные по итогам разговора, его нужно внедрить в crm-систему. После общения с клиентом все данные звонка робот переносит в одну карточку, чтобы менеджеры видели, кто работает с человеком и на какой стадии сотрудничество.

Шедеврум

Прежде чем внедрять ИИ в бизнес, нужно разобраться, какие проблемы компании должна решать программа и в каком виде нужно подключать искусственный интеллект: чат-бот, нейросеть, голосовой робот или робот для логистики или анализа данных. Вот несколько шагов, которые помогут внедрить новые технологии в бизнес.

Анализировать продажи и покупательскую способность — искусственный интеллект может собирать отчеты на основе покупательской активности. Затем по этим данным прогнозировать спрос на определенную продукцию: например, зимой люди чаще заказывают горячие напитки и еду с доставкой в офис, а летом берут прохладный кофе, салаты и заходят лично, потому что приятно прогуляться. Руководство кафе решает расширять меню с учетом этих данных.

GigaChat – это русскоязычная мультимодальная нейросетевая модель, способная вести диалог, отвечать на вопросы, подготавливать тексты и формировать изображения по запросу. Для доступа к GigaChat необходимо посетить официальный сайт чат-бота либо запустить его в Telegram или «ВКонтакте». Ситуация с доступом к нейросети противоположная ChatGPT: если там нужен зарубежный IP, то для доступа к GigaChat от «Сбера», наоборот, необходим российский IP, а авторизация осуществляется через «Сбер ID». Если вы пользуетесь «Сбербанком Онлайн», то «Сбер ID» – это номер вашего телефона. В России GigaChat функционирует без ограничений. Как и ChatGPT, он отлично подходит для интеграции в сторонние чат-боты и сервисы. Запросы также можно осуществлять на разных языках. Для личного использования нейросеть предоставляется бесплатно (freemium-режим). Речь идет об 1 млн токенов (единицы информации, на которые делятся запросы) без дополнительной платы ежегодно: 950 000 токенов для GigaChat Lite и 50 000 токенов – для GigaChat Pro. Если токены закончились, их можно докупить. Для бизнеса чат-бот платный: минимальная стоимость – 600 рублей в месяц при 0,2 рубля за 1000 токенов. В GigaChat используется совокупность нейросетевых моделей, которую разработчики назвали NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Изначально использовалась модель ruGPT-3 размером 13B (то есть с 13 млрд параметров), обученная на корпусе данных в 300 Гбайт (книги, новостные заметки на русском и английском языках, научные статьи и т. п.). Потом использовались ruGPT-3.5 и FRED-T5. В настоящее время ядром чат-бота GigaChat является GigaChat версии 29В (29 млрд параметров). Для работы с изображениями используется отдельная модель «Кандинский» версии 3.1 (Kandinsky 3.1). Как и в случае с другими нейросетями, при работе с GigaChat особое значение имеет грамотно составленный запрос (промпт). Кстати, не стоит забывать, что нейросети могут отвечать похожими фразами на одни и те же вопросы, но каждый раз ответы будут хотя бы немного различаться, так как генерируются заново.

ЧИТАТЬ ТАКЖЕ:  Почему искусственный интеллект актуален

Несмотря на то, что чат-бот официально недоступен в России, не упомянуть его нельзя – это самая популярная и одна из наиболее развитых нейросетей на сегодняшний день. В мае 2024 года была представлена последняя публично доступная версия модели – GPT-4o (где «o» значит «omni»). Новинка способна в режиме реального времени анализировать все основные виды данных – текст, аудио, изображения, видео и комбинации из них – и генерировать в ответ текст, аудио, изображения и комбинации из них. Чат-бот способен реагировать на входящие аудиозапросы со скоростью 232–320 мс, что сопоставимо с реакцией среднестатистического человека в процессе обычной беседы. Что касается текстового режима работы, то производительность GPT-4o соответствует GPT-4 Turbo на английском языке и языках программирования, однако с другими языками, доступными в модели, новая версия стала работать гораздо быстрее. Кроме того, ChatGPT-4o лучше «видит» и «слышит» в сравнении с предыдущими моделями. Средняя задержка в голосовом режиме общения с чат-ботом версии GPT-3.5 составляла 2,8 с, а с GPT-4 – 5,4 с. Такая высокая задержка в предыдущих версиях нейросети связана с тем, что ранее голосовой режим ввода функционировал с использованием трех отдельных моделей, работавших в виде конвейера. А в GPT-4o реализована единая модель сквозного анализа и обучения с помощью разных типов данных. Разработчики признают, что это первая модель компании OpenAI, в которой используется подобный подход, в связи с чем они изучают ее возможности и ограничения вместе с пользователями. Новая модель может напрямую оценивать тон собеседника, его эмоции, определять фоновые шумы и многое другое, поддерживает множество языков запросов, в том числе русский. А также может генерировать тексты на разные темы, поддерживать беседы, писать стихи, решать математические задачи, анализировать, исправлять и писать с нуля код на языках программирования, петь и т. д. Помимо технологических достижений, OpenAI обещает делать все возможное для того, чтобы ее модель была доступна как можно большему числу заинтересованных пользователей по всему миру, к тому же на бесплатной основе. В этом определенно есть доля лукавства, так как чат-бот ChatGPT доступен не во всех странах. Да и лимиты на запросы в бесплатной версии не сильно впечатляют: их количество зависит от загрузки серверов компании в конкретный момент времени, а так как сейчас наблюдается ажиотаж, то рассчитывать на существенные квоты не стоит.

Шаг 3. Выбрать инструменты, которые помогут улучшить рабочий процесс. Чем больше вариантов использования, тем эффективнее будет работать алгоритм. Например, медицинский центр хочет принимать больше клиентов, и ему нужна программа с искусственным интеллектом, которая будет обрабатывать все обследования пациента и ставить предварительный диагноз. Врачу не нужно анализировать десятки анализов и обследований, это делает программа с искусственным интеллектом. Ценность программы с искусственным интеллектом должна быть очевидной для компании.

Принципы работы с подавляющим большинством чат-ботов довольно просты. Взаимодействие с ними осуществляется в рамках непосредственного диалога, во многом похожего на беседу людей в реальном мире. Некоторые нейросети воспринимают запросы к себе в свободной форме, другие требуют соблюдения некоторых правил, в том числе грамматических. Самое главное, что требуется от пользователя при общении с любой нейросетью, – четкое понимание, что необходимо получить в результате совместной работы. Обычно необходимо определиться с целевым контентом, с тем чтобы правильно выбрать соответствующий инструмент. Дело в том, что универсальных нейросетей не так много, тогда как большинство ИИ-инструментов заточены под определенный тип данных (текст, изображения, видео, аудио и т. п.). Далее очень важно указать максимальное число деталей, которые могут описывать желаемый результат, – это может быть цветовая палитра и/или стиль, которому должен соответствовать контент. Например, можно попросить нейросеть подготовить рассказ о черных дырах в научно-популярном стиле или нарисовать (а точнее сказать, «сгенерировать») закат на море в стиле импрессионистов. Отдельно можно задать нюансы подачи текстовой или визуальной информации. Например, попросить раскрыть тему, не упоминая определенные ее аспекты. И, пожалуй, самая главная особенность рабочего процесса с чат-ботом – последовательная доработка контента. То есть если пользователь недоволен промежуточным результатом, он продолжает уточнять запросы для нейросети до тех пор, пока не добьется нужного исхода. В связи с этим в Сети появилось немало мемов, так как нейросети иногда упорно отказываются выполнять какие-либо действия либо выполняют их очень своеобразно, что приводит к нелепым или смешным результатам. Что касается работы с отдельными плагинами (например, для интернет-браузеров), в которые встроены некоторые функции нейросетей, то здесь принципы взаимодействия плюс-минус те же, однако с поправкой на особенности конкретного приложения.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь