создание входных файлов для последующих конвейеров обработки данных - PullRequest
0 голосов
/ 20 июня 2019

Я пытаюсь запустить исходный код для расширения набора на основе корпуса с использованием необработанных текстовых файлов. Для этой цели я использую Stanford NLP. Согласно файлу Readme, первым этапом предварительной обработки данных является преобразование необработанного текста в предложения .json.

Я запустил сервер для Stanford NLP, а также установил его библиотеку оболочки Python. Мне интересно, как мне поступить дальше, как именно я должен преобразовать этот текстовый файл в предложения.json

...