Я новичок в Python (3) и Beautifulsoup (4), пытаюсь научиться webscraping.
Я очищаю список членов шведского парламента. Почти все имена в выходных имеют (S) рядом с ними (члены социал-демократической партии). Первые четыре имени отсутствуют (S).
Есть ли способ добавить это к каждому имени без него, возможно, с
условное утверждение? «Если элемент списка не содержит« (S) », добавьте его
в конце этого элемента списка. "
Кроме того, возможно ли отформатировать имена как нижние?
Код:
source = urllib.request.urlopen("https://www.riksdagen.se/sv/ledamoter-
partier/socialdemokraterna/").read()
soup = bs.BeautifulSoup(source, "lxml")
namn = soup.find_all("span", {"class": "fellow-name"})
for span in soup.find_all("span", {"class": "fellow-name"}):
resultat = (span.text.strip())
print(resultat)
Вывод:
Stefan Löfven
Anders Ygeman
Annelie Karlsson
Lena Rådström Baastad
Ahlberg, Ann-Christin (S)
Andersson, Johan (S)
Axelsson, Marie (S)
...