Я новичок в области НЛП и пытаюсь токенизировать слово из текста и данных JSON. Я мог бы сделать это успешно для текстовых данных, но не смог сделать это на JSON
import nltk
from nltk.tokenize import word_tokenize
import json
with open('Data.json') as f:
data = json.load(f)
tokenized_text_json = word_tokenize(data)
Выдает ошибку, ожидаемую строку или байтовоподобный объект. Но я знаю, что здесь «данные» - это словарь. Есть ли метод или библиотека для хранения их в виде строки?
Я попробовал приведенный ниже код, но он не работал
data = nltk.data.load("Data.json", "json")
Я хотел бы загрузить данные в формате, который можно использовать для токенизации. Спасибо!