У меня возникла проблема с очисткой текста внутри тега без получения всех данных html.Вот мой код Python.Текст, который я хочу очистить, находится не внутри класса span, а стоит сам по себе в теге.Вот пример того, где находится текст.
<a href="/counterstrike/rankings/team-details/32537">
<span class="ranking">49</span>
<span class="flag flag-pl" data-tooltip="" tabindex="1" title="Poland></span>
TEXT-I-WANT-TO-SCRAPE
<span class="elo">1103</span>
</a>
Если я использую функцию ".text.encode ('utf8'). Lstrip (). Rstrip ()", я все равно получаю такие данные:
print (textt) '49 \ n \ n \ n \ n ТЕКСТ-Я ХОЧУ СОЗДАТЬ \ n \ n 1103 '
Мой вопрос: как мне получить толькотекст внутри тега?
Нет проблем в очистке как elo, так и ранжирования, поскольку они содержатся внутри промежутков с определенными классами.
def get_matches():
matches = get_parsed_page("https://www.gosugamers.net/counterstrike/rankings")
rankings = matches.find("ul", {"class": "ranking-list"})
matchdays = rankings.find_all("li")
for match in matchdays:
matchDetails = match.find_all("a")
for getMatch in matchDetails:
elo = match.find("span", {"class": "elo"}).text.encode('utf8').lstrip().rstrip()
ranking = match.find("span", {"class": "ranking"}).text.encode('utf8').lstrip().rstrip()
textt = match.find("a").text.encode('utf8').lstrip().rstrip()
print(ranking,elo,textt)
С уважением