В основном я пытаюсь отфильтровать столбец моей таблицы базы данных, которая содержит содержимое нескольких тысяч HTML-файлов.
Когда я пытаюсь это сделать, я получаю эту ошибку:
TypeError: ожидаемая строка или байтовоподобный объект.
Поэтому я попытался преобразовать содержимое всех строкстолбца с:
input_table [["Document"]] = input_table[["Document"]].astype(str)
Поскольку я работаю с knime, таблица выходных данных говорит мне, что тип выходных данных столбца - строка.
Но когда я использую этоRegex с Python:
import re
text = re.findall("^<span", str)
Я получаю вышеупомянутую ошибку.
Кто-нибудь может помочь с этим?
Спасибо.