BeautifulSoup не дает мне получить текст - PullRequest
0 голосов
/ 11 ноября 2018

Я хочу получить весь текст в теге

Он дает мне текст в консоли, но не помещает его в файл .txt.

Работает с body.text, но не с article.text. Я не знаю, что делать.

import bs4 as bs
import urllib.request
#import re

sauce = urllib.request.urlopen('http://www.bodoniparavia.it/index.php/it/amministrazione-trasparente/bandi-di-gara-e-contratti.html')
soup = bs.BeautifulSoup(sauce,'lxml')


body = soup.body
article = body.find('article')
article1 = article.text
print(article1)

x = open('file.txt','w')
x.write(article1)
x.close

1 Ответ

0 голосов
/ 12 ноября 2018

Мне кажется, это работает нормально, но попробуйте добавить encoding = 'utf-8' в оператор записи. Теперь код будет выглядеть так:

import bs4 as bs
import urllib.request
#import re

sauce = urllib.request.urlopen('http://www.bodoniparavia.it/index.php/it/amministrazione-trasparente/bandi-di-gara-e-contratti.html')
soup = bs.BeautifulSoup(sauce,'lxml')


body = soup.body
article = body.find('article')
article1 = article.text
print(article1)

x = open('file.txt','w',encoding = 'utf-8')
x.write(article1)
x.close()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...