Красивый суп: извлечение данных из вложенных классов и промежутка - PullRequest
0 голосов
/ 06 апреля 2020

Я ищу руководство по решению этой проблемы, с которой я столкнулся. Я использую BeautifulSoup и Python 3.7.

По сути, я пытаюсь извлечь «Амиду» из показанных ниже метаданных. Я могу сделать это для одного указанного c div (data - search -sol meta), но я не могу сделать это для всех из них. Код, который я использую для извлечения:

tag=soup_data.findAll("div",attrs={"class":"_3MPUOLE"})

for t in tag:
    print (t.findNext("span",attrs={"class":"_3FrNV7v _3PZrylH E6m4BZb","class":"_3FrNV7v _3PZrylH E6m4BZb"}).text

. Вышеприведенный код дает мне «Амиду», но я хочу провести l oop через все элементы div и извлечь тексты, такие как «Амида». Единственная хитрость здесь в том, что некоторые компании на самом деле являются «частными рекламодателями» и не имеют «автоматизации данных».

  • Кроме того, я попробовал описанное выше с помощью метода t.findallnext и с использованием атрибута .text, но это не соответствует тому, что, как я думал, будет.
for t in tag:
    print (t.findAllNext("span",attrs={"class":"_3FrNV7v _3PZrylH E6m4BZb","class":"_3FrNV7v _3PZrylH E6m4BZb"}))

Любая помощь / руководство будет высоко ценится.

Спасибо

HTML Data

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...