Моя общая цель - изолировать теги, которые содержат определенное слово в тексте, и только те из них печатаются в текстовый файл.
До сих пор мне удавалось извлечь конкретный тег, в данном случаеи заставить их печатать в текстовый файл.
Мой вопрос: как только я получу весь текст в извлеченном файле, что я могу с ним сделать?У меня возникают проблемы с поиском способа изолировать определенное слово и дополнительно обрезать текст до того, что мне нужно.
Вот что у меня есть:
import urllib2
from BeautifulSoup import BeautifulSoup
url = 'http://www.website.com'
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
page = soup.findAll('title')
for element in page:
print element
file_name = raw_input("What do you want to name the file?> ")
text_file = open("/Users/user1/Projects/%s.txt" % file_name, "w")
text_file.write("%s" % page)
text_file.close()
Что получаетсямне возвращено:
$<title>food</title>
<title>ball</title>
<title>car</title>
<title>desk</title>
<title>blue food</title>
<title>green food</title>
<title>red ball</title>
Как я могу получить печать только результатов, включающих «еду»?