Я пишу сканер с использованием scrapy и, используя следующую строку Python, мне удалось получить данные, которые я ищу:
Python line:
response.css("article.college div.span8.profile > table > tbody > tr").extract()
Возвращает мне следующий результат:
['<tr>\n<th>Institution Name:</th>\n<td>Harvard University</td>\n</tr>',
'<tr>\n<th>Administration</th>\n<td>Private</td>\n</tr>',
'<tr>\n<th>State</th>\n<td>\nMassachussets\t\n</td>\n</tr>']
Однако я хотел бы получить доступ к индексации значения атрибута по имени атрибута. Я хочу сделать что-то вроде этого:
response.css(<magic containing 'Institution Name'>)
И сможет получить соответствующее значение, в этом случае это:
\n<td>Harvard University</td>\n
Может кто-нибудь помочь мне понять это?
Спасибо