tivoo 13 февраля 2020 12

Извлечь строковую часть кода HTML в новый столбец

tivoo / 13 февраля 2020

Привет, поэтому у меня есть столбец с кучей кода HTML, и я хочу извлечь часть этого кода в виде строки в новый столбец. Я пробовал следующее:

df['extract'] = df['HTML_code'].str.extract(r'\<!-- PREHEADER -->(.+?)<!-- END PREHEADER -->')

Но безуспешно. Я получаю столбец со значениями NaN. Также преобразование кода HTML в UTF-8 не дает мне ничего, кроме ошибок. Какой путь к go здесь?

Заранее спасибо.

...