Может ли машина заменить интуицию журналиста?

С помощью алгоритма, который назвали Octopus, Tamedia попыталась определить, способна ли машина принимать решения за редакторов и журналистов, когда речь идет о курировании контента для разных платформ. 

,

,

Испытательной площадкой для этого технологического эксперимента послужило приложение медиакомпании 12-app, которое дает пользователям доступ к двенадцати главным материалам дня в одном выпуске. Приложение было создано три года назад, и с тех пор его (бесплатно) скачали около 300 тысяч раз, а доступ к нему ежемесячно осуществляют почти сто тысяч уникальных пользователей, утверждает Михаэль Марти, руководитель отдела цифрового редакционного развития Tamedia.

12-app призвано способствовать превращению новых пользователей приложения в подписчиков за 9 швейцарских франков (8 евро) в месяц. Причем за первые «пробные» две недели оплата не взимается, далее бесплатно пользователи получают доступ только к одной статье в месяц. По словам Марти, у приложения несколько тысяч платных подписчиков.

 

АВТОМАТИЗАЦИЯ, ПРИДИ!

Контент для каждого ежедневного выпуска 12-app берется из общего портфолио медиакомпании, которое включает флагманскую ежедневную газету Tages-Anzeiger, около 20 региональных газет и женские журналы.

Как правило, с 7.00 до 8.30 утра сотрудники 12-app просматривают сайты, газеты и журналы Tamedia, чтобы скомпоновать дневной выпуск, после чего на редакционной планерке окончательно утверждается отобранное.

«Это вполне традиционный, но при этом сложный и долгий способ отбирать статьи, — говорит Марти. — Поэтому мы вскоре начали задумываться о разработке системы для поддержки или даже полной автоматизации процесса отбора».

Сотрудники обратились к специалистам Tamedia по работе с данными, которые предложили построить алгоритм для автоматизации процесса курирования контента, с чего и начался проект Octopus.

 

ОПЕРАЦИЯ OCTOPUS

«Мы хотели, чтобы алгоритм отбирал типичные для 12-app статьи, то есть статьи, похожие на те, которые публиковались в предыдущих выпусках, — говорит Марти. — Поэтому нам надо было научить нейронную сеть отличать суть материалов для 12-app от всех остальных статей».

Они построили базу данных из 3000 материалов, которые были отобраны редакторами в прошлом, чтобы научить алгоритм распознавать характеристики статей для 12-app.

Суть или статистические свойства статьи для 12-app затем преобразуются в машинно-читаемый формат путем автоматического анализа текста и обработки естественного языка, которые формируют основу для обучения сети искусственного интеллекта распознавать различия между теми статьями, которые считаются подходящими для 12-app, и всеми остальными.

,

,

Приложение 12-app, в котором применяется алгоритм для автоматизации процесса курирования контента Octopus, дает пользователям доступ к двенадцати главным материалам дня

,

Материалам присваиваются баллы, которые указывают на степень их сходства с ранее публиковавшимися статьями (в компании это называют «12-аппность»). На основе этих баллов, а также нескольких встроенных фильтров алгоритм к утру генерирует список из десяти самых подходящих материалов, отобранных из массива, включающего свыше 400 статей. Затем список публикуется на канале в Slack, где его может открыть и проверить редактор.

Алгоритм имеет также функционал обратной связи с редакторами, давая им возможность сообщить, понравилось им предложенное или нет, что способствует дальнейшему совершенствованию алгоритма.

 

ВКАЛЫВАЮТ ВСЕ

Что касается результатов, Марти заявил, что алгоритм извлекает контент из гораздо большего числа источников, чем смог бы человек, и при этом около 50 % предложенного им редакторы считают подходящим и используют при составлении выпусков. Кроме того, он вдвое сокращает время на отбор статей (примерно до 45 минут), не влияя при этом на общее качество выпуска.

,

В ИДЕАЛЕ ПОДОБНУЮ СИСТЕМУ НУЖНО ИСПОЛЬЗОВАТЬ КАК ВСПОМОГАТЕЛЬНУЮ, ПОЭТОМУ МЫ ОСТАНОВИЛИСЬ НА КОМБИНАЦИИ ЧЕЛОВЕКА И МАШИНЫ

,

«Необходимо признать, что полностью автоматизированное курирование нереально в таких основанных на качественных характеристиках продуктах, как приложение из серии «лучшее из…», — резюмирует Марти. — В идеале подобную систему нужно использовать как вспомогательную для процесса принятия решений, поэтому мы остановились на комбинации человека и машины».

Алгоритму труднее всего определять злободневность материала, поскольку он опирается исключительно на текст, без учета метаданных и контекста в целом.

«Еще ему трудно приходится со статьями на тему культуры, где мы публикуем много рецензий, поскольку он ошибочно принимает их за очерки или репортажи, — сетует Марти, но с оптимизмом продолжает: — Работа над проектом не останавливается, так что мы непрерывно совершенствуем обучающий алгоритм». 

 

Материал подготовлен WAN‑IFRA и СППИ (ГИПП)

,

Фото: 12app.ch; twitter.com/michaelmarti; shutterstock.com