Что такое нейросеть хабр

0
18

Временной обзор для бэкендеров на Хабр Карьере

Зачем нужен «Нейролаб»

Национальная языковая модель является необходимой частью критической инфраструктуры искусственного интеллекта, уверен ведущий эксперт Центра компетенций Национальной технологической инициативы (НТИ) «Искусственный интеллект» на базе МФТИ Александр Родин: «С учетом того, с какой скоростью технологии ИИ проникают в обыденную жизнь и практику корпоративного и государственного управления, потеря технологического суверенитета грозит не только некорректно принятыми решениями, но и деградацией русского языка и русской идентичности в целом». Безусловно, задача чрезвычайно амбициозная и требует не только значительных финансовых вливаний, но и чрезвычайно компетентной команды, пояснил он «Эксперту».

Гонения на российских разработчиков в среде ПО с открытым кодом продолжаются. Им начали отказывать в приеме патчей и предложений и открыто заявлять, что это только потому, что они россияне. С такой дискриминацией отечественный программист из «Яндекса» столкнулся при попытке внести изменения в репозиторий проекта Spring.

Российский разработчик из «Яндекса» Ахтям Сакаев столкнулся с открытой дискриминацией по национальному признаку на GitHub (принадлежит Microsoft). Его запрос на внесение изменений в репозиторий (Pull Request) был отклонен только лишь потому, что он россиянин. Об этом ему открыто заявили в комментариях.

«Российским разработчикам часто недоступны ресурсы и инфраструктура, которыми обладают их зарубежные коллеги, поэтому „Нейролаб“ может стать необходимой базой для старта и реализации инновационных проектов», — выразил уверенность в комментарии «Эксперту» член комитета по образованию и науке ассоциации «Национальный Фонд Искусственного Интеллекта», основатель онлайн-школы NEURODA Дмитрий Анашкин. Кроме того, формирование «банка идей» с поддержкой и финансированием поможет разработчикам довести свои идеи до реальных продуктов, что в конечном итоге может укрепить российский ИИ-рынок, считает он.

Национальная модель потребует значительных вложений и поддержки, чтобы оставаться конкурентоспособной, она должна быть доступной и гибкой, чтобы ее можно было адаптировать к различным задачам — от бизнес-аналитики до образовательных и государственных проектов, рассуждает Дмитрий Анашкин. Полностью устранить политическую предвзятость невозможно, поскольку любой текстовый корпус отражает определенные взгляды и ценности общества, в котором он создавался. В связи с этим отбор материалов, на которых обучается модель, — это ключевой вопрос на стадии оценки инициативы, уверен основатель онлайн-школы NEURODA Анашкин.

Новый виток развития эта история получила в октябре 2024 г. 11 россиян были без предупреждения и внятных причин исключены из списка мейнтейнеров ядра Linux. На следующие сутки создатель Linux Линус Торвальдс (Linus Torvalds) лично прокомментировал произошедшее – он назвал исключенных россиян «кучкой русских троллей» и заявил, что решение по их выдворению отменено не будет.

Одной из целей создания национальной LLM разработчики «Нейролаб» видят укрепление технологической независимости России и устранение политической предвзятости, которая может проявляться в моделях, разработанных крупными корпорациями. Для этого они планируют обучать свою модель только на русскоязычных текстах.

«Нейролаб» начал работу в тестовом режиме с конца сентября. Подразумевается, что в рамках платформы МСП крупный бизнес и ведомства смогут получать адресные меры поддержки, в том числе различные инструменты финансирования, консультации по вопросам использования ИИ в работе организации, обучающие материалы и доступ к вычислительным мощностям. Доступ к мощностям будут обеспечивать организации из области криптомайнинга: «Битривер Рус», Intelion Data Systems и Ассоциация промышленного майнинга.

«Нейролаб» объединит МСП, корпорации и ведомства, дав им вычислительные мощности

Таким образом, маловероятно, что «Нейролаб» изобрел качественно новый подход к обучению LLM, сомневается Алексей Калабурдин. Сегодня не обучают нейросети только на русском языке, а больше занимаются их дообучением, — вероятно, потому, что качество на выходе лучше, согласно бенчмаркам типа Russian SuperGLUE, рассуждает он.

В чате будут проходить обсуждения и прямые сессии с представителями компаний, где можно задать вопросы и получить ответы на интересующие моменты. Таким образом, Вайб-чек становится не только инструментом для поиска работы, но и пространством для обмена опытом и знакомств, которое может привести к новым карьерным возможностям.

Таким образом, Вайб-чек на Хабр Карьере представляет собой многоаспектный проект, который адресует актуальные потребности специалистов в IT-сфере, предлагая массу возможностей для профессионального развития и личного роста в более комфортной — «вайбовой» — атмосфере.

Платформа «Нейролаб» работает как некоммерческая организация, ее главная цель — создание и поддержка рынка ИИ в России, подчеркнул в ходе пресс-конференции в ТАСС первый заместитель председателя комитета Госдумы по информационной политике, информационным технологиям и связи Антон Ткачёв. Вычислительные мощности платформа может предоставлять бесплатно любому разработчику — для этого каждый отдельный проект должен пройти оценку, сообщил генеральный директор платформы Intelion Data Systems Тимофей Семенов. Планируется, что уже к 2026 г. совокупные вычислительные мощности для разработки ИИ в рамках проекта достигнут 1 экзафлопса (триллион операций в секунду), сообщил основатель и генеральный директор компании «Битривер Рус» Игорь Рунец. «Нейролаб» не предполагает установленного потолка финансирования, оно осуществляется на проектной основе.

ЧИТАТЬ ТАКЖЕ:  Как искусственный интеллект разговаривает

Сегодня в тесте качества русскоязычных моделей Russian SuperGLUE насчитывается 42 LLM, например от Сбера, «Яндекса» и независимых команд, таких как Saiga team, отмечает руководитель Data Science AdTech-экосистемы Hybrid Алексей Калабурдин: «Они обучены на данных с русскоязычных ресурсов, в частности на постах Pikabu.ru, Habr, стихах и новостях. Нейросети и данные для них есть в открытом доступе. Пользователи могут их скачать и бесплатно использовать. Например, на платформе Hugging Face Hub, куда исследователи, в том числе русские, могут выложить свои модели, уже насчитывается более 3638 русскоязычных нейросетей».

После этого пользователь LashaDev обратился к Минелла и спросил у него: «Если кто-то еще (например, не имеющий отношения к России) откроет такой же запрос, вы примете его? Итак, вы решили отклонить это предложение, основываясь только на этнической принадлежности автора. Звучит странно. Как вы считаете, это вообще законно?

Новая платформа «Нейролаб» объединит разработчиков искусственного интеллекта, бизнес и государство, предоставит им вычислительные мощности, финансирование и консультации. Проект связывает мощности российских криптомайнеров ресурсоемкими проектами в сфере больших языковых моделей (LLM). Также в его рамках будет создана общенациональная LLM на базе текстов на русском языке. По оценкам разработчиков, она должна будет проявлять меньше политической предвзятости, чем модели, созданные крупными корпорациями. Об этом заявили представители Центра технологий искусственного интеллекта (ЦТИИ) на пресс-конференции «Создание национальной модели ИИ: результаты работы ЦТИИ „Нейролаб“».

После закрытия запроса Сакаева другой пользователь GitHub с никнеймом akuleshov7 создал точно такой же Pull Request. В профиле akuleshov7 написано: «Я из Нидерландов (возможно, не из России (вероятно). Пожалуйста, не блокируйте меня, я могу доказать это с помощью моей ID-карты и моих документов (но как вы это проверите?)» (I am from Netherlands (may be), not from Russia (probably). Please do not ban me, i can prove it with my id card and documents. (but how you would check it?))

Преимущества участия в Вайб-чеке

На Вайб-чеке команды из пяти компаний — Selectel, Nexign, X5 Digital, МКБ и SM Lab — открывают карты и делятся своими впечатлениями о работе. Участники могут пройти специальный вайб-квиз, который поможет определить, какая из компаний наилучшим образом соответствует их устремлениям и личностным качествам. Такой формат может радикально изменить подход к собеседованиям и поиску работы в целом.

Не менее важным аспектом является возможность развивать сеть профессиональных контактов. В конце теста участников ждет приглашение в чат карьерной настолки, где они смогут не только познакомиться с коллегами, но и поучаствовать в играх, которые помогут снять напряжение и обогатить тусовку.

Предполагается, что эта LLM будет расширяться со временем за счет постепенного добавления в нее текстов — в рамках мультагентной инкрементальной архитектуры, указал в интервью «Эксперту» директор по инвестициям УК «Битривер» Даниил Половинка. Модель не будет ограничена только русскоязычными текстами, она также будет обучаться на иностранных текстах, переведенных на русский язык. Первая версия модели будет содержать в себе 7 млрд параметров, со временем этот показатель увеличится до 60 млрд. Для сравнения: число параметров в ChatGPT 3.5 составляет 175 млрд. В модели будут применяться инструменты улучшения ответов, которые не будут зависеть от числа параметров. Возможность взаимодействия с моделью через API разработчики могут получить уже через год, сообщает он.

Сама Broadcom, по всей видимости, активно поддерживает антироссийские санкции. Еще в сентябре 2023 г. в Рунете часто встречались упоминания о блокировке учетных записей россиян на сайте компании, вследствие чего владельцы профилей, в числе прочего, лишались доступа к различной технической информации по продукции Broadcom.

После случившегося Минцифры предложило создать в России суверенное сообщество разработчиков Linux. Но стоит напомнить, что после массовых блокировок на GitHub власти заговорили о создании национального репозитория свободного ПО, который так и не был запущен. Более того, осенью 2024 г. выяснилось, что планы по его разработке и вовсе были отменены.

Минелла написал Сакаеву: «Благодарим вас за этот вклад. К сожалению, как проект, реализуемый Broadcom, мы не можем принимать материалы из российских источников из-за экспортной политики Broadcom в настоящее время. Спасибо за то, что вы продолжаете использовать Spring» (Thank you for this contribution. Unfortunately, as a project stewarded by Broadcom, we are unable to accept contributions from Russian sources due to Broadcom export policy at this time. Thanks for your continued use of Spring).

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь