Невозможно проанализировать RSS-канал с помощью Python, но другие приложения RSS-канала в Chrome могут анализировать данные - PullRequest
0 голосов
/ 19 апреля 2019

Я работаю над базовым скриптом Python, который анализирует данные RSS-ленты с веб-сайта SEC.gov, но он не работает, когда я запускаю скрипт.Где я ошибаюсь?

Я использую версию Python 3.6.5, и я пытался использовать библиотеки Atoma и feedparser, но я не могу успешно извлечь какие-либо данные SEC RSS.Честно говоря, возможно, формат данных RSS-канала не в допустимом формате (я проверил https://validator.w3.org/feed/ и он показывает, что данные недействительны).Но когда я пытаюсь использовать ту же строку в расширении RSS-канала Google Chrome, это работает, поэтому я, должно быть, делаю что-то не так.Кто-нибудь знает, как решить проблему с форматом, или я неправильно это делаю в Python?

import atoma, requests

feed_name = "SEC FEED"
url ='https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=0001616707&type=&dateb=&owner=exclude&start=0&count=100&output=atom'
response = requests.get(url)
feed = atoma.parse_rss_bytes(response.content)

for post in feed.items:
  date = post.pub_date.strftime('(%Y/%m/%d)')
  print("post date: " + date)
  print("post title: " + post.title)
  print("post link: " + post.link)
...