Кто-нибудь знает о наборе данных, в котором есть метаданные о новостных статьях?
Основные требования к набору данных:
- 100k + новостные статьи
- Обложки для 5+ публикаций
- От 15 до 15 лет статей
- Метаданные о каждой статье с именами авторов + год публикации
- Должны быть получены законным путем (без разбивочных данных TOS)
Я просмотрел много потенциальныхисточники.Вот несколько примеров: