Команда ВКонтакте сейчас работает над искусственным интеллектом для автоматического распознавания хейтспича — враждебных высказываний. С помощью новой технологии модераторы смогут быстрее обрабатывать жалобы пользователей и блокировать ненужный контент.
Искусственный интеллект учится находить материалы и публикации, которые провоцируют агрессию у аудитории. По идее новая нейросеть должна выявлять проявления ксенофобии, расизма, гомофобии, сексизма, а также угрозы и оскорбления на почве религиозной принадлежности, возраста, внешности или заболеваний.
Для обучения искусственного интеллекта, ВКонтакте добавила новую категорию жалоб — «Враждебные высказывания». Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды Модерации и Поддержки не только реагируют на жалобы, но и проводят внутренний мониторинг.
Иван Корнеев, руководитель команды модерации ВКонтакте обращается к пользователям соцсети:
«Мы разделяем позицию наших пользователей и партнёров касательно языка вражды и прославления насилия. Модераторы ВКонтакте ежедневно обрабатывают огромный объём контента, в том числе с использованием искусственного интеллекта — большинство опасных материалов удаляются ещё до того, как их кто-то увидит. Если же вы заметили оскорбительную публикацию, пожалуйтесь на неё. С проявлениями нетерпимости эффективнее бороться вместе — и мы призываем пользователей присоединяться к нам в этой борьбе».
За 2020 год на платформе было удалено 520 тысяч единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих хейтспитч.
Источник: Пресс-служба ВКонтакте