Я пытаюсь проанализировать все значения в столбце этого веб-сайта (с различными биржевыми индексами) . Я работаю в Python и использую XPath для очистки данных HTML.
Допустим, я хочу извлечь значение «Изменение», которое в настоящее время составляет 0,62% (и зеленого цвета). Сначала я получу дерево на сайт, а затем скажу.
stockInfo_1 = tree.xpath('//*[@class="table-dark-row"]/td[12]/b/span/text()')
Затем я получу массив значений, и последним элементом будет изменение значения.
Однако я заметил, что если значение в этом столбце имеет цвет, оно находится в /b/SPAN
, в то время как если оно не имеет цвета, то интервал отсутствует, и его просто в /b
.
Чтобы объяснить:
stockInfo_1 = tree.xpath('//*[@class="table-dark-row"]/td[12]/b/span/text()')
^ этот массив будет иметь все значения в этом столбце, которые окрашены
while stockInfo_1 = tree.xpath('//*[@class="table-dark-row"]/td[12]/b/text()')
^ будет иметь все значения в столбце, которые не имеют цвета.
Цвета не одинаковы для каждой акции. Некоторые акции имеют случайные значения, которые имеют цвета, а некоторые нет. Таким образом, это нарушает согласованность массивов /b/span
и /b
.
Как я могу получить массив переменных ВСЕХ значений (по порядку) в каждом столбце, независимо от того, находятся они в диапазоне или нет? Мне плевать на цвета, я просто забочусь о значениях.
Я могу объяснить больше, если нужно. Спасибо !!