Я собираюсь создать систему, которая может кластеризовать новостные данные онлайн на основе события, с которым они связаны.Для проверки правильности результата мне нужен большой набор новостей с пометкой на тему.И мне кажется почти невозможным маркировать их вручную.Так может кто-нибудь поделиться некоторыми советами, как я могу получить руку на этот тип набора данных?Большое спасибо за помощь.