Я хотел бы почистить linkedin только для личного использования (нужно получить пост на странице компании-друга), и я использую Selenium и BeautifulSoup для этого.
Я обнаружил, что каждый пост - это div, и у них всех есть класс ember-view
, но у спонсируемых постов также есть этот класс, который я не хочу чистить, больше копаясь в коде HTML, я обнаружил, что Я мог бы выбрать сообщения пользователя, выбрав все div, которые имеют значение: urn:li:activity:XXXXXXXXXX
для атрибута data-urn
.
Однако в каждом сообщении div, XXXXXXX
- это другое число, как я могу выбрать все div с помощью data-urn=urn:li:activity:XXXXXXXXX
, учитывая, что XXXXXXXX
является изменяющимся числом в каждом div?