Я пытаюсь отфильтровать таблицу базы данных по строкам .html файлов, но получаю сообщение об ошибке: TypeError: ожидаемая строка или байтовоподобный объект - PullRequest
0 голосов
/ 14 октября 2019

В основном я пытаюсь отфильтровать столбец моей таблицы базы данных, которая содержит содержимое нескольких тысяч HTML-файлов.

Когда я пытаюсь это сделать, я получаю эту ошибку:

TypeError: ожидаемая строка или байтовоподобный объект.

Поэтому я попытался преобразовать содержимое всех строкстолбца с:

input_table [["Document"]] = input_table[["Document"]].astype(str)

Поскольку я работаю с knime, таблица выходных данных говорит мне, что тип выходных данных столбца - строка.

Но когда я использую этоRegex с Python:

import re


text = re.findall("^<span", str)

Я получаю вышеупомянутую ошибку.

Кто-нибудь может помочь с этим?

Спасибо.

1 Ответ

0 голосов
/ 07 ноября 2019

Эта строка неправильно написана на python:

input_table [["Document"]] = input_table[["Document"]].astype(str)

В python это должно быть:

input_table ["Document"] = input_table["Document"].astype(str)

это должно преобразовать ваш столбец в строку.

...