Откройте онлайн текстовый файл, используя python codecs.open - PullRequest
0 голосов
/ 23 апреля 2019

Я пытаюсь открыть онлайн текстовый файл, используя codecs.open.Код, который у меня сейчас есть:

url = r'https://www.sec.gov/Archives/edgar/data/20/0000893220-96-000500.txt'
soup = BeautifulSoup(codecs.open(url, 'r',encoding='utf-8'), "lxml")

Однако Python продолжает напоминать OSError:

OSError: [Errno 22] Invalid argument: 'https://www.sec.gov/Archives/edgar/data/20/0000893220-96-000500.txt'

Я пытался заменить «/» на «\».Это все еще не работает.Есть ли способ решить это?Поскольку мне нужно открыть более тысячи ссылок, я не очень хочу загружать текстовые файлы в Интернете на свой локальный диск.

Я буду очень признателен, если кто-то сможет мне здесь помочь.

Спасибо!

1 Ответ

1 голос
/ 23 апреля 2019

Вы думаете о чем-то подобном?

`from urllib.request import urlopen
url = urlopen('https://www.sec.gov/Archives/edgar/data/20/0000893220-96- 000500.txt')
 html = url.read().decode('utf-8')
 file = open('yourfile.txt', 'r')
 file.read(html)
 file.close`
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...