Хорошо, давайте немного уточним, прежде чем ответить на ваш вопрос.
Следующие утверждения верны:
- Существуют различные форматы ConNLL
- Различныеобщее для форматов то, что они получены из CoNLL конференции.
- Spacy предоставляет через CLI конвертер для 2 различных форматов: простой формат conll и самый последний формат conllu.Вы можете найти больше о формате conll здесь и больше о формате conllu здесь
- Conllul - это другой формат данных, представленный в 2018 году. Вы можете прочитать больше здесь
- Spacy не поддерживает прямое преобразование между форматами conllul и json.
Имея все это в виду, ответ на ваш вопрос, я думаю, будет целесообразно использоватьформат conllu для вашего языка, который является стандартным способом работы с данными на естественном языке с помощью spacy.Я обнаружил, что в вашем наборе древовидной системы ud для вашего языка есть данные в формате.Вы можете скачать данные с здесь и затем использовать конвертер spacy для преобразования их в json.
Я действительно надеюсь, что это помогло.:)