как использовать readlines () - PullRequest
0 голосов
/ 02 мая 2020

При запуске следующего кода я получаю сообщение об ошибке, как показано ниже. Может кто-нибудь, пожалуйста, помогите мне с этим.

import urllib
import requests
url = "https://www.sec.gov/Archives/edgar/data/1800/000104746918000856/0001047469-18-000856.txt"
page = urllib.request.urlopen(url).read()
page.decode('utf-8')
text_list = page.decode('utf-8').readlines()

AttributeError: у объекта 'str' нет атрибута 'readlines'

Ответы [ 2 ]

1 голос
/ 02 мая 2020

Похоже, вы хотите список, содержащий каждую строку того, что возвращается. Этот код поможет:

import urllib
import requests
url = "https://www.sec.gov/Archives/edgar/data/1800/000104746918000856/0001047469-18-000856.txt"
page = urllib.request.urlopen(url).read()
text_list = page.decode('utf-8').split('\n')
0 голосов
/ 02 мая 2020
page.decode()

возвращает строку. readlines () работает с файловыми объектами. Поэтому, если бы у вас был файловый объект, вы бы:

linesList = fileObject.readlines()

Подробнее см. Python readlines description Ответ выше показывает, как по-прежнему получать строки с вашим декодированным объектом страницы, используя разделители на строке. Файловые объекты не являются строками, но работают как дескрипторы файла, в котором могут быть строки.

...