Содержание статьи
Как создать искусственный интеллект: все, что нужно знать
Угроза из облака
Мы уже объясняли, что общий и сверхинтеллект — это всего лишь гипотезы, когда речь идет об искусственном интеллекте. Как следствие, ваш ИИ должен будет что-то делать. Прежде чем приступать к написанию и проектированию алгоритмов машинного обучения, необходимо решить, что будет делать ваш ИИ.
Языковых моделей на сегодня разработано множество, но значительная часть из них не имеет широкой практической применимости. Тем не менее существуют удобные и общедоступные ИИ-инструменты, хорошо подходящие для решения конкретных задач, будь то генерация текстов (например, Mistral 7B) или создание фрагментов кода (например, Code Llama 13B). Поэтому при выборе модели необходимо сузить выбор до нескольких принципиально подходящих кандидатов, а затем убедиться, что ресурсов вашего компьютера хватит для их запуска.
На этой неделе в открытом доступе появилась бета-версия еще одного многообещающего инструмента, Chat With RTX от NVIDIA. Производитель самых востребованных чипов для AI представил локальный чат-бот, способный пересказывать содержимое видеороликов с YouTube, обрабатывать коллекции документов и многое другое — при наличии у пользователя Windows-компьютера с 16 Гб памяти и видеокартой NVIDIA RTX 30-й или 40-й серии с восемью и более гигабайтами видеопамяти. «Под капотом» — все те же разновидности Mistral и Llama2 с Hugging Face. Разумеется, мощные видеокарты позволяют повысить производительность генерации, но, по отзывам первых тестеров, существующая бета достаточно громоздка (около 40 Гб) и сложна в установке. Однако в будущем Chat With RTX от NVIDIA может оказаться очень многообещающим локальным ИИ-ассистентом.
Написание алгоритмов
Алгоритмы — это математические инструкции, которые указывают системе искусственного интеллекта, что делать и как улучшить ее работу. Суть ИИ-решения заключается в алгоритмах, на которых оно основано. Выбрав язык программирования и платформу, вы можете написать свои собственные алгоритмы.
Угрозы от подобных инцидентов зависят от того, для каких целей применяются ИИ-помощники. Если вы генерируете милые иллюстрации к сказкам собственного сочинения или просите у ChatGPT составить план трехдневной экскурсионной поездки в столицу, вряд ли утечка сможет нанести вам серьезный ущерб. Если ваша переписка с чат-ботом потенциально может содержать конфиденциальные фрагменты — персональные данные, пароли или номера банковских карт, — допускать утечку в облако уже нельзя. Но ее относительно легко предотвратить, предварительно отфильтровав данные, и об этом у нас есть отдельный пост.
В качестве стартовой планки можно ориентироваться на компьютеры, которые считались относительно мощными в далеком 2017 году: процессоры не ниже Core i7 с поддержкой инструкций AVX2, 16 Гб оперативной памяти и видеокарты с 4 Гб памяти. Для любителей Mac подойдут модели на базе Apple Silicon M1 и более новые, а требования к памяти не изменятся.
Какое оборудование нужно для запуска нейросети
Фреймворки также предлагают шаблоны и руководства, которые помогут вашей команде создавать нейронные сети и другие прогностические модели. Scikit, Pytorch и Tensorflow — наиболее популярные фреймворки и библиотеки для разработки моделей машинного обучения.
Вооруженные этим знанием, вы готовы открыть сокровищницу открытых бесплатных языковых моделей, а именно — топ Open LLM Leaderboard. В этом списке ИИ-инструменты отсортированы по нескольким метрикам качества генерации, а с помощью фильтров легко отключить слишком крупные, слишком мелкие или слишком точные модели.
А вот в случаях, когда либо вся переписка конфиденциальна (например, медицинская или финансовая информация), либо же надежность предварительной фильтрации сомнительна (нужно обрабатывать большие объемы данных, которые никто не будет предварительно отсматривать и фильтровать), выход только один — перенести обработку из облака на локальный компьютер. Конечно, запустить свою версию ChatGPT или Midjourney без Интернета вряд ли удастся, но другие нейросети, работающие локально, дают сравнимое качество при меньшей вычислительной нагрузке.
В связи с этим растет интерес бизнеса к отказу от готовых решений в области ИИ, и все больше компаний рассматривают возможность создания собственной системы ИИ. Несмотря на то, что инициирование проекта по созданию ИИ для вашей организации может показаться недоступным, создание систем ИИ не так сложно, как вы думаете.
Развернуть
Если вы успешно построили и обучили свою модель, пришло время ее развертывания. Разумеется, необходимо следить за ее работой, чтобы убедиться, что она соответствует ожиданиям. Вероятно, со временем потребуется дополнительное обучение для повышения точности и производительности модели искусственного интеллекта.
Хорошая новость для тех, у кого нет доступа к мощному оборудованию, — существуют упрощенные ИИ-модели, способные решать практические задачи даже на старом железе. А если ваша видеокарта совсем простая и слабая, то возможно использовать модели и среды их запуска, использующие только центральный процессор. В зависимости от задач они могут даже обеспечивать приемлемую скорость работы.