У меня есть код, который выполняет поиск по определенным ключевым словам на веб-сайте
Когда я использую print(url, count, the_word)
, он дает мне результаты, но я не могу преобразовать это в извлекаемый набор данных.Я пытался использовать его, но он выводит только последний результат поиска.
def getLinks(url):
html_page = urlopen(url)
soup = bs(html_page)
links = []
for link in soup.find_all('a', href=True):
links.append(link.get('href'))
newlist=[ii for n,ii in enumerate(links) if ii not in links[:n]]
newlist.insert(0,url)
return newlist[0:10]
the_words = ['20gb', '10gb']
total_words = []
for the_word in the_words:
for url in getLinks('https://www.bt.com/'):
r = requests.get(url, allow_redirects=False)
soup = bs(r.content.lower(), 'lxml')
words = soup.find_all(text=lambda text: text and the_word.lower() in text)
count = len(words)
words_list = [ ele.strip() for ele in words ]
for word in words:
total_words.append(word.strip())
#print('\nUrl: {}\ncontains {} of word: {}'.format(url, count, the_word))
print(url, count, the_word)
results=url,count,the_word
#df=pd.DataFrame(results, columns=[the_word])
#df.to_csv(r'C:\Users\nn1\Downloads\Python\trial.csv')
#print(total_words)
Я хочу экспортировать код print(url, count, the_word)
в виде файла CSV, как есть.