BeautifoulSoup4 извлечь заголовок из исходного кода - PullRequest
0 голосов
/ 16 ноября 2018

Я ищу способ извлечь строку Название заголовка из следующего исходного кода:

<div class="specs__party-group">
    <a href="Url" title="Title Name" class="specs__party"  data-no-translate="true">General
    </a>
</div>

Используется пакет BeautifoulSoup4. В исходном коде есть несколько

<a title = ... </a> 

структуры. Например:

<div class="show-more__fade  js_show-more-button">
    <a href="#" title="showmore">
    </a>
  </div>
</div>

Однако я хочу только строку заголовка из блока class="specs__party-group".

Следующие коды (найденные здесь) не дали мне желаемого результата:

title = soup.find_all('a', title=True, class_='specs__party-group')

Или

for link in soup.find_all('div', attrs={'class': 'specs__party-group'}): 
    title= link.get('title')

Есть еще предложения?

1 Ответ

0 голосов
/ 16 ноября 2018

Тег, на который вы нацеливаетесь, несет класс «specs__party», а не «specs__party-group».

Это должно работать:

title = soup.find_all('a', class_='specs__party')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...