У меня есть этот код для Python, но он ищет фактическую страницу, а не источник страницы.
import requests
from bs4 import BeautifulSoup
def count_words(url, the_word):
r = requests.get(url, allow_redirects=False)
soup = BeautifulSoup(r.content, 'lxml')
words = soup.find(text=lambda text: text and the_word in text)
print(words)
return len(words)
def main():
url = 'google.com'
word = 'google'
count = count_words(url, word)
print('\nUrl: {}\ncontains {} occurrences of word: {}'.format(url, count, word))
if __name__ == '__main__':
main()
Как мне сделать это для поиска источника страницытоже?
Я не хочу считать.Да, я знаю, что должен удалить часть count {}
.Но как мне сделать так, чтобы он загружал список веб-сайтов из текстового файла, и если найдено слово x для печати «X найдено на этом веб-сайте»
Любая помощь приветствуется!