layovers = browser.find_elements_by_xpath("//span[@data-test-id='layover-airport-stops']")
layovers_list = [value.text for value in layovers]
Для извлечения данных из Интернета я использовал приведенный выше код.
try:
df.loc[i, 'layovers'] = layovers_list[i]
except Exception as e:
pass
Однако первые несколько данных пустые / нулевые, поэтому python автоматически извлекает данные из других рейсы с ненулевыми / незаполненными отложениями на матч с первыми несколькими данными, что приводит к неправильному совпадению, поскольку на первых нескольких рейсах нет отложений. Я думал о создании пустых данных 0. 1) Поскольку я не слишком знаком с HTML, могу ли я узнать, есть ли способ отредактировать данные?
2) Могу ли я знать, какой тип данных (например, строка, список) в browser.find_elements_by_xpath("//span[@data-test-id='layover-airport-stops']")
? Это будет полезно знать, потому что я хотел бы нарезать данные для других целей. например. Я хотел сделать это, но я не мог airport_list=[]
for value in airport:
airport_list.append(value[1:3])
return airport_list