Токенизация данных JSON с использованием nltk - PullRequest
0 голосов
/ 29 августа 2018

Я новичок в области НЛП и пытаюсь токенизировать слово из текста и данных JSON. Я мог бы сделать это успешно для текстовых данных, но не смог сделать это на JSON

import nltk
from nltk.tokenize import word_tokenize
import json

with open('Data.json') as f:
    data = json.load(f)

tokenized_text_json = word_tokenize(data)

Выдает ошибку, ожидаемую строку или байтовоподобный объект. Но я знаю, что здесь «данные» - это словарь. Есть ли метод или библиотека для хранения их в виде строки?

Я попробовал приведенный ниже код, но он не работал

data = nltk.data.load("Data.json", "json")

Я хотел бы загрузить данные в формате, который можно использовать для токенизации. Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...