Мне нужно предварительно обработать данные, выполнив токенизацию и лемматизацию перед построением инвертированного индекса.Мне нужна помощь в выяснении, как использовать NLTK в Dict Object.Или есть другая возможность?Опция преобразования объекта dict в объект str также не работает, так как она создает больше беспорядка в виде escape-символов
Я также пытался выполнить применение, понимание dict и другие методы.Теперь мне нужна помощь в выполнении функций NLTK в объекте dict.