Я не могу заставить Тику работать ни с чем, кроме функции печати.Кто-нибудь знает, что здесь происходит?
- Я связал test = str (raw1) и получил код ошибки 415
- Я попробовал test = word_tokenize (raw1 ['content']) иполучить ключевое слово error для контента
Я пробовал несколько других вещей, но ничего не получилось, кроме печати.Он печатает разобранный текст на терминал отлично.
def loopexttok(self, event=None):
get_file_Location = self.n_string.get()
for root, dirs, files in os.walk(get_file_Location):
for file_name in files:
import tika
from tika import parser
raw1 = parser.from_file(file_name)
print(raw1)
Я ожидал сохранить код в виде str или создать словарь предложений из проанализированного текста, который я могу очистить и поместить вбазы данных с другим кодом, но не может заставить Тику что-либо делать, кроме как распечатать разобранный текст.
Кроме того, если я не импортирую Тику непосредственно над вызовом синтаксического анализатора, Тика вообще не будет работать.