Очистить HTML-таблицу с гиперссылками, используя panda.read_html - PullRequest
0 голосов
/ 26 сентября 2018

Я очищаю веб-страницу, и на странице есть HTML-таблица.Я хочу разобрать эту таблицу в панде.Я использовал pandas.read_html, и это работает.Тем не менее, записи одного столбца являются гиперссылками, и мне нужно извлечь эти гиперссылки тоже.Любые предложения?

Пример

Col 0 Col 1 Col2

0 123 abc

1 567 efg

2 901 igk

Теперь я получаю в моем фрейме данных все записи, но без базовой ссылки.В конце концов, я хотел бы иметь еще один столбец в моем фрейме данных с базовыми записями, но сейчас я был бы признателен за извлечение лежащих в основе ссылок link1, link2 и link3.

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...