Привет, поэтому у меня есть столбец с кучей кода HTML, и я хочу извлечь часть этого кода в виде строки в новый столбец. Я пробовал следующее:
df['extract'] = df['HTML_code'].str.extract(r'\<!-- PREHEADER -->(.+?)<!-- END PREHEADER -->')
Но безуспешно. Я получаю столбец со значениями NaN. Также преобразование кода HTML в UTF-8 не дает мне ничего, кроме ошибок. Какой путь к go здесь?
Заранее спасибо.