Извлечь жирный текст из JSON - PullRequest
0 голосов
/ 21 февраля 2020

Я использую Google API и GS C, чтобы получить жирный шрифт из htmlSnippet:

from apiclient.discovery import build
from bs4 import BeautifulSoup

search_term="search term in Google"

api_key=""

resource=build("customsearch", 'v1', developerKey=api_key).cse()

result=resource.list(q=search_term,cx=' ').execute()

for i in result['items']:
    html=str(i['htmlSnippet'])
    print(html)

Так я получаю что-то вроде этого:

Metadescription from Google in <b>bolds text</b>. Here there is <b>another bold</b>

Затем я пытаюсь с этим:

soup=BeautifulSoup(html,"lxml")
    print(soup.find_all('b'))

И это работает, но я не могу получить только текст.

Пытаюсь с:

soup=BeautifulSoup(html,"lxml")
    print(soup.find_all('b').text)

Didn не работает = /

Пожалуйста, помогите мне!

1 Ответ

0 голосов
/ 21 февраля 2020

soup.find_all() возвращает список, вам нужно получить текст каждого из них в al oop.

print(b.text for b in soup.find_all('b'))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...