Я хочу тренироваться, используя команду spacy train
в командной строке. Я использовал сопоставление на основе правил для получения данных о тренировках, и оно находится в списке кортежей, например (TEXT, {'entities':[(start, end, 'ORG')]})
. Я просто немного озадачен тем, как преобразовать это в JSON / формат, который можно использовать с пространственным обучением CLI. Я не могу использовать docs_to_json
, так как они не делают c объекты. Есть ли способ использовать что-то вроде spacy convert
для этого типа данных? Или есть другой способ использовать эти помеченные данные в CLI?