Вы ищете текст TELEVISION
, который является частичной строкой, содержащейся в теге td
.
. Таким образом, чтобы достичь этого, вы можете использовать регулярное выражение .
import requests
from bs4 import BeautifulSoup
import re
page_link ='https://www.txdot.gov/insdtdot/orgchart/cmd/cserve/bidtab/12033001.htm'
page_response = requests.get(page_link, timeout=5)
page_content = BeautifulSoup(page_response.content, "html.parser")
match = page_content.find_all(text=re.compile("TELEVISION"))
print(len(match))
Или, если у вас beautifulsoup
4.7.1 или выше, вы можете использовать css selector
и содержит.
import requests
from bs4 import BeautifulSoup
page_link ='https://www.txdot.gov/insdtdot/orgchart/cmd/cserve/bidtab/12033001.htm'
page_response = requests.get(page_link, timeout=5)
page_content = BeautifulSoup(page_response.content, "html.parser")
match = page_content.select('td:contains(TELEVISION)')
print(len(match))
Обратите внимание, что вы должны использовать точный текст, который у вас есть на веб-страницы.