Я пытаюсь получить одну СТРОКУ символов с ВЕБ-САЙТА, но меня не волнует все используемое кодирование / декодирование. Я всегда получаю СТРОКУ с не кодированными символами.
Есть мой код:
#!/usr/bin/env python
# -*- coding: latin-1 -*-
import urllib2
import requests
from BeautifulSoup import BeautifulSoup
url = 'https://www.lavanguardia.com/alminuto'
response = requests.get(url)
html = response.content
soup = BeautifulSoup(html)
contenido = soup.find('ul', attrs={'class': 'results-list'})
for row in contenido.findAll('a'):
if len(str(row.findAll(text=True)))>2:
a = row.findAll(text=True)
print str(a).strip("[]'u'").decode('latin-1')
Например, я получаю это:
Луканамарка, Эль-Хамбре-де-Ше-де-ла-Резня
Поставлено:
Луканамарка, Эль-Хамбре-де-ла-резня
anyone Кто-нибудь знает, как я могу кодировать эти ( \ xe9s ) символы для получения правильных результатов?
Спасибо