Подготовка помеченных данных о тренировках для обучения через spaCy CLI - PullRequest
0 голосов
/ 17 января 2020

Я хочу тренироваться, используя команду spacy train в командной строке. Я использовал сопоставление на основе правил для получения данных о тренировках, и оно находится в списке кортежей, например (TEXT, {'entities':[(start, end, 'ORG')]}). Я просто немного озадачен тем, как преобразовать это в JSON / формат, который можно использовать с пространственным обучением CLI. Я не могу использовать docs_to_json, так как они не делают c объекты. Есть ли способ использовать что-то вроде spacy convert для этого типа данных? Или есть другой способ использовать эти помеченные данные в CLI?

...