У меня мало опыта программирования, поэтому прошу прощения за мое невежество.
Я пытаюсь проанализировать страницу «Ключевая статистика» из Yahoo!Финансы, если быть точным это страница.Я дурачился с BeautifulSoup и смог извлечь данные, которые хотел, но с тех пор натолкнулся на умственный блок.Я хотел бы, чтобы данные отображались следующим образом:
measure[i]: value[i]
.
.
measure[n]: value[n]
, но результаты, которые я получаю с помощью сценария:
measure[i]
.
.
measure[n]
value[i]
.
.
value[n]
Вот моя попытка объединения двух полей данныхвместе, который выдает ошибку:
measure = soup.findAll('td', {'class':'yfnc_tablehead1'}, width='74%')
value = soup.findAll('td', {'class':'yfnc_tabledata1'})
for incident in measure:
x = incident.contents
for incident2 in value:
y = incident2.contents
data = x + y
print ': '.join(data)
Более того, в этих значениях есть нежелательные символы, которые я хотел бы удалить, но я прочитаю документацию re.compile и re.sub.
Спасибо за любой вклад.