Текущее поведение:
При попытке использовать пакет агрегатора новостей Newspaper3k я не могу получить согласованный / надежный вывод.
Настройка системы / среды:
Windows 10
Miniconda3 4.5.12
Python 3.7.1
Newspaper3k 0.2.8
Шаги (код) для воспроизведения:
import newspaper
cnn_paper = newspaper.build('http://cnn.com')
print(cnn_paper.size())
Ожидаемое поведение / выход (зависит от текущих ссылок, опубликованных на cnn):
Производить согласованное количестворазмещенные ссылки на cnn при последовательных выводах на печать.
Фактическое поведение / вывод
При первом выполнении кода количество ссылок будет отличаться от количества ссылок, запускаемых сразу после.
1st Run Print output: 94 (as of time of posting this question)
2nd Run Print output: 0
3rd Run Print output: 18
4th Run Print output: 7
Печать фактических ссылок будет зависеть от печати счетчика выше.Я попытался использовать несколько различных источников новостей, и те же самые неожиданные результаты отклонения.Нужно ли менять заголовок User-Agent?Это проблема обнаружения?Как получить достоверные результаты?
Любая помощь будет высоко ценится.
Спасибо.