Я хочу преобразовать текстовый файл формата IOB в формат SpaCy с указанием начального и конечного индексов для каждого токена.
Я запускаю этот код:
python -m spacy convert test_IOB.txt out --converter jsonl --lang English
Я получил ошибку:
ValueError: Unexpected character found when decoding 'true'
Мои входные данные выглядят так:
the O
r O
/ O
p O
( O
years O
) O
ratio O
of O
the O
sand O
is O
16 O
. O
chiaramonte O
, O
l. O
2008 O
, O
geomechanical O
characterization O
and O
reservoir O
simulation O
of O
a O
co O
sequestration O
project O
in O
a O
mature O
ofield O
Спасибо!