[EDITED]
Я использую Google App Engine и пытаюсь проанализировать HTML-контент, чтобы извлечь некоторую информацию.Код, который я использую:
from google.appengine.ext import webapp
from google.appengine.ext.webapp import util
from google.appengine.api import urlfetch
import BeautifulSoup
class MainHandler(webapp.RequestHandler):
def get(self):
url = 'http://ascodevida.com/ultimos'
result = urlfetch.fetch(url=url)
# ADVS de esta página.
res = BeautifulSoup.BeautifulSoup(result.content).findAll('div', {'class' : 'box story'})
ADVList = []
for i in res:
story = i.find('a', {'class' : 'advlink'}).string
link = i.find('a', {'class' : 'advlink'})['href']
ADVData = {
'adv' : story,
'link' : link
}
ADVList.append(ADVData)
self.response.headers['Content-Type'] = 'text/html; charset=UTF-8'
self.response.out.write(ADVList)
И этот код вызывает ответ со странными символами.Я пытался использовать методы prettify () и renderContent () библиотеки BeautifulSoup, но это неэффективно.
Какие-нибудь решения?Еще раз спасибо.