Я пытаюсь открыть онлайн текстовый файл, используя codecs.open.Код, который у меня сейчас есть:
url = r'https://www.sec.gov/Archives/edgar/data/20/0000893220-96-000500.txt' soup = BeautifulSoup(codecs.open(url, 'r',encoding='utf-8'), "lxml")
Однако Python продолжает напоминать OSError:
OSError: [Errno 22] Invalid argument: 'https://www.sec.gov/Archives/edgar/data/20/0000893220-96-000500.txt'
Я пытался заменить «/» на «\».Это все еще не работает.Есть ли способ решить это?Поскольку мне нужно открыть более тысячи ссылок, я не очень хочу загружать текстовые файлы в Интернете на свой локальный диск.
Я буду очень признателен, если кто-то сможет мне здесь помочь.
Спасибо!
Вы думаете о чем-то подобном?
`from urllib.request import urlopen url = urlopen('https://www.sec.gov/Archives/edgar/data/20/0000893220-96- 000500.txt') html = url.read().decode('utf-8') file = open('yourfile.txt', 'r') file.read(html) file.close`