Ответ Шишдема превосходен, если вы хотите получить много статей из общего архива новостей о сканировании (также называемого обычным сканированием новостей о сканировании или CCNC).
Однако, если вы ищете только несколько статей, вы можете использовать NewsPlease.from_urls([url1, url2, ...], timeout=6)
для сканирования этих статей (см. https://github.com/fhamborg/news-please#use-within-your-own-code-as-a-library). Обратите внимание, эта команда не поддерживает фильтрацию изполе, но я бы все-таки предпочел его (и последующую фильтрацию статей, реализованный самостоятельно) по сравнению с общим вариантом новостей архива сканирования - пожалуйста, если вы просто хотите иметь несколько статей. Одна из причин этого заключается в том, что длячтобы получить отфильтрованное подмножество статей из CCNC, теоретически вам необходимо обработать полный CCNC, поскольку статьи в CCNC не обязательно упорядочены по дате публикации. Например, можно отсканировать статью от 1 января 2018 года в новостной ленте ACCNC всего лишь через день, хотя может случиться, что другая статья от 2 января 2018 года, опубликованная издателем B, будет просканирована месяцем или даже годом позже.