Question

Я новичок в области НЛП и пытаюсь токенизировать слово из текста и данных JSON. Я мог бы сделать это успешно для текстовых данных, но не смог сделать это на JSON

import nltk
from nltk.tokenize import word_tokenize
import json

with open('Data.json') as f:
    data = json.load(f)

tokenized_text_json = word_tokenize(data)

Выдает ошибку, ожидаемую строку или байтовоподобный объект. Но я знаю, что здесь «данные» - это словарь. Есть ли метод или библиотека для хранения их в виде строки?

Я попробовал приведенный ниже код, но он не работал

data = nltk.data.load("Data.json", "json")

Я хотел бы загрузить данные в формате, который можно использовать для токенизации. Спасибо!

Токенизация данных JSON с использованием nltk

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Токенизация данных JSON с использованием nltk

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов