Содержание статьи
Нейросеть ВК обучают на ваших комментариях (и это законно! )
Какие права имеет ВКонтакте на контент пользователей
Время от времени по соцсетям прокатываются волны запретов пользователей на использование контента со своих страниц. Они направлены, в первую очередь, в адрес администраций соцсетей и отделов, занимающихся разработкой и обучением нейросетей. Такие волны запретов бороздили и ныне запрещенные иностранные соцсети, и российские. Пост-запрет ВК выглядит примерно так:
Но подобные сообщения не имеют никакой юридической силы – соглашение с ВК подписано, и оснований менять его у пользователя нет. Надо понимать, что все авторские права защищены Гражданским кодексом РФ, в соответствии с которым и составлялось Соглашение, и соцсеть вправе использовать их на основе неисключительного права и безвозмездно (не получая от этого материальной выгоды – денег).
В компании рассказали, что нейросеть умеет определять предметы и сущности, изображенные на фото. Она понимает не только «человек», «ребенок», «животное», «растение», но и может определить, например, предмет одежды, символ «групп смерти». В целом нейросеть имеет несколько тысяч классов, которые присваиваются фотографиям — от 0 до 1 по нескольким параметрам. Если алгоритм характеризует фото как «опасное», оно отправляется модераторам для проверки. Если же фото признано «умеренно опасным», оно пропадает из поисковой выдачи, а в новостной ленте понижается его приоритет. Механизм помогает остановить распространение спама, мошенничества, детской порнографии, нелегальных услуг и другой противоправной деятельности.
Отдельный сценарий предусмотрен для борьбы с суицидальным контентом. Записи и фото на эту тему удаляются автоматически, а страницы их авторов блокируются.
Отмечается, сервис может создавать обложки в разных стилях, включая «Супрематизм», «Футуризм», «Пуантилизм», «Мозаика», «Киберпанк» и др. Если алгоритму будет недостаточно информации о человеке, то пользователя попросят добавить больше данных или подписаться на отражающие его интересы сообщества.
Чтобы создать обложку для своей страницы достаточно перейти на страницу сервиса «Обложка от ВКонтакте» и нажать кнопку «Начать». После этого нейросеть за несколько секунд сгенерирует шесть обложек в разных стилях с учётом интересов пользователя. Останется лишь выбрать понравившийся вариант и нажать кнопку «Установить обложку», после чего изображение автоматически появится в профиле. Кроме того, результатом работы нейросети можно поделиться через публикации или истории.
Но, разумеется, в таком обучении есть и минусы. И речь пойдет даже не про этичность использования данных. Социальные сети часто отображают предвзятые мнения и некорректную информацию, а также мысли здесь могут излагаться с помощью ненормативной лексики, грубых выражений, мата. Обучение моделей на таких данных может усилить эти предвзятости, что отрицательно скажется на качестве генерируемого контента».
Могу ли я запретить использовать материалы со своей страницы в соцсети
Соцсеть «ВКонтакте» начала использовать «обученный» алгоритм собственной разработки, который присваивает картинкам специальный рейтинг, определяя, содержится ли в них противоправный или «опасный» контент. Алгоритм распознает на картинках объекты — людей, животных, растения. Выявленный «запрещенный» контент не попадает в поисковую выдачу и «умную» новостную ленту либо полностью блокируется. Технология также способна анализировать текстовые надписи на изображениях.
Если пользователь загружает картинку или упоминает хэштеги, которые ранее использовали в качестве призыва к суициду, «ВКонтакте» блокирует его страницу и предлагает сообщить о причинах публикации. На основании ответов определяется, когда страница будет разблокирована, и дальнейшие действия: пользователю может быть предложена помощь психологов фонда «Твоя Территория» или советы по безопасности страницы. Алгоритм также помогает формировать «умную» новостную ленту, которая была введена «ВКонтакте» в прошлом году, — записи от друзей и сообществ отображаются не в хронологическом порядке, а по приоритету, максимально интересному конкретному пользователю. Присваивание классов нужно не только для удаления противоправных изображений, но и для формирования ленты пользователя с учетом его интересов. Если человек ставит лайки на фотографиях с кошками, то в персонализированной ленте в приоритете ему будут чаще выводиться записи с кошками. На сегодняшний день, по данным «ВКонтакте», «умной» лентой пользуется 80% активной аудитории соцсети. Руководитель направления Big Data и Machine Learning «ВКонтакте» Андрей Законов рассказал, что сейчас нейросеть тестируют на анализ текста поверх изображений. По его словам, технология необходима в первую очередь для того, чтобы сделать новостную ленту пользователя «максимально полезной и интересной». — Нейросеть анализирует только изображения, загружаемые для общего доступа, то есть отправляемые фото в личных сообщениях не анализируются, — пояснил Андрей Законов. — С помощью этой технологии в будущем мы сможем бороться со спамом и мошенничеством. Мы обучили нашу нейросеть на основе жалоб пользователей на разный контент. Технология нейросетей известна уже много лет, но популярной ее сделали многопользовательские приложения, превращающие фотографии в произведения искусства. Первой была Prisma от выходца из Mail.ru Group, позднее такое же приложение с названием Vinci выпустила «ВКонтакте», а затем и сама Mail.ru Group выпустил приложение Artisto, которое уже редактировало видео.
«7.1.5. Пользователь предоставляет также Администрации Сайта неисключительное право использовать на безвозмездной основе размещенный на Сайте и принадлежащий ему на законных основаниях Контент в целях обеспечения Администрацией Сайта функционирования Сайта в объёме, определяемом функциональностью и архитектурой Сайта, и отображения Контента в промоматериалах Администрации Сайта, в том числе в рамках изображений интерфейса Сайта, в том числе путём доведения таких промоматериалов до всеобщего сведения. Указанное неисключительное право предоставляется на срок размещения Контента на Сайте и распространяет свое действие на территории стран всего мира. Окончание срока размещения Контента на Сайте и/или срока действия неисключительного права не влечет за собой необходимость изъятия из оборота промоматериалов Администрации Сайта с отображением Контента (в том числе их удаление из сети Интернет). Администрация Сайта вправе передавать права, указанные в настоящем пункте третьим лицам».
Проще говоря, ВКонтакте вправе брать любую информацию из соцсети «на безвозмездной основе». Это значит, что ВК может использовать любые посты и комментарии для обучения своих языковых моделей, даже если они создаются для третьих лиц (а уж тем более для родственного Mail.ru). И все пользователи ВКонтакте под этим подписались.
«Обложки в профилях помогают подчеркнуть индивидуальность, выделиться и привлечь внимание аудитории к своим увлечениям. Нашим пользователям понравился такой способ самовыражения, они активно добавляют обложки в свои профили. Новая функция дополнительно расширяет возможности творчески оформить виртуальное пространство: сервис предлагает персонализированные иллюстрации для каждого человека. Нейросети «ВКонтакте» позволяют визуально продемонстрировать интересы пользователя, причём делают это стильно, оригинально и точно. На генеративной обложке может быть показано, каким спортом увлекается владелец профиля, его музыкальные предпочтения или в каких играх он проводит время», — прокомментировал запуск нового сервиса технический директор «ВКонтакте» Александр Тоболь.
В отличие от стандартных алгоритмов, запрограммированных выполнять определенные действия, нейросеть работает по принципу человеческого мозга. Ее учат анализировать данные и принимать решения самостоятельно. Например, Google сейчас развивает нейросеть в своем сервисе-переводчике так, чтобы она могла переводить тексты с одного языка на другой, как это сделал бы человек. Основатель компании «АРБ Диджитал» (работает в сфере анализа данных и машинного обучения, в том числе создания и применения искусственных нейронных сетей в прикладных бизнес задачах) Владислав Арбатов рассказал, что в любой соцсети есть проблема суицидальных проявлений и противоправной деятельности, но все с ней борются по-разному. По его словам, уже существуют нейросети, которые не только умеют распознавать предметы на фото, но и делать осмысленные описания. — Например, Instagram просто блокирует посты по хэштегу «синий» и предлагает обратиться за квалифицированной помощью, но это не очень эффективно. А вот использование VK более подходящего способа с распознаванием изображений, — большой плюс и будет более эффективным, — заявил Владислав Арбатов. — Текстовый контент и сейчас можно проанализировать, провести поиск, старгетировать рекламу на его основе, а вот изображение нужно сначала распознать. Грубо говоря, это перевод картинки в текстовый вид, пригодный для множества задач. Instagram, Facebook тоже используют технологии машинного обучения, как для выявления контента 18+, так и для более релевантной для пользователя ленты, причем Facebook еще использует алгоритм для людей с ограниченными возможностями — пользователи со слабым зрением могут запустить «читалку», узнать, что изображено на картинке. Научный сотрудник Университета Иннополис Леонард Йохард рассказал, что классификация изображений — серьезное достижение в области нейронных сетей. — Нейронные сети справляются с простыми задачами по распознаванию объектов гораздо лучше, чем люди, погрешность при обнаружении однородного объекта, как правило, составляет всего несколько процентов, — заявил Леонард Йохард. — Безусловно, визуальный суицидальный и эротический контент — это субъективные понятия, которые во многом зависят от контекста, поэтому подобный контент сложнее распознать по сравнению с обычными объектами. Анализ cодержания изображения — объект пристального внимания в научной среде с многообещающими результатами. Это интересная, но непростая задача. Конечно, в процессе работы будут ошибки, но по мере увеличения объема собранных данных результаты станут лучше. Эксперт добавил, что мнения относительно развития тренда в области классификации изображений и видео расходятся. Некоторые представители сообщества специалистов по технологии глубокого обучения заявляют, что нейронные сети могут развить более глубокое восприятие мира просто за счет отслеживания очень больших объемов изображений и видео. Другие считают, что нейронные сети еще долго будут познавать этот мир, так как истинное понимание происходит только в процессе комплексного взаимодействия с ним.