Создать текстовый файл из памяти, но не удалось открыть файл - PullRequest
0 голосов
/ 26 апреля 2020

Я практикую очистку веб-страниц и сохраняю контент в текстовый файл, когда я запускаю код, он проходит гладко и не сообщается об ошибке, но я просто не могу открыть файл, который создает и сохраняет контент после него. я использую ма c, но у меня есть учебник для windows, не могли бы вы помочь мне с проблемой, спасибо.

import requests
import time
import re


headers = {'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}

f = open('/Users/pgao/Desktop/doupo.rtf','a+')

def get_info(url):
    res = requests.get(url, headers = headers)
    if res.status_code == 200:
        contents = re.findall('<p>(.*?)</p>', res.content.decode('utf-8'),re.S)
        for content in contents:
            f.write(content+'\n')
    else:
        pass

if __name__ == '__main__':
    urls = ['http://www.doupoxs.com/doupocangqiong/{}.html'.format(str(i)) for i in range(2,10)]
    for url in urls:
        get_info(url)
        time.sleep(1)

f.close()

1 Ответ

0 голосов
/ 26 апреля 2020

Попробуйте выполнить следующие действия:

В приложении TextEdit на вашем Ma c выберите TextEdit> Настройки, затем нажмите «Открыть и сохранить».

Выберите «Показать файлы RTF как RTF-код вместо отформатированного текста. ”

Затем попробуйте открыть RTF, сделайте c.

Также измените код заголовка на:

headers = {'user_agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}

Поскольку заголовок всегда диктует
Надеюсь, это поможет:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...