Question

В основном я пытаюсь отфильтровать столбец моей таблицы базы данных, которая содержит содержимое нескольких тысяч HTML-файлов.

Когда я пытаюсь это сделать, я получаю эту ошибку:

TypeError: ожидаемая строка или байтовоподобный объект.

Поэтому я попытался преобразовать содержимое всех строкстолбца с:

input_table [["Document"]] = input_table[["Document"]].astype(str)

Поскольку я работаю с knime, таблица выходных данных говорит мне, что тип выходных данных столбца - строка.

Но когда я использую этоRegex с Python:

import re


text = re.findall("^<span", str)

Я получаю вышеупомянутую ошибку.

Кто-нибудь может помочь с этим?

Спасибо.

PV8 · Answer 1 · 07 ноября 2019

Эта строка неправильно написана на python:

input_table [["Document"]] = input_table[["Document"]].astype(str)

В python это должно быть:

input_table ["Document"] = input_table["Document"].astype(str)

это должно преобразовать ваш столбец в строку.

Я пытаюсь отфильтровать таблицу базы данных по строкам .html файлов, но получаю сообщение об ошибке: TypeError: ожидаемая строка или байтовоподобный объект

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.