Решение состоит в том, чтобы взять входной файл в зависимости от того, что вы хотите проверить на модели , и преобразовать его в файл TSV , который можно подать на модель ner с помощью следующей команды
java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier ner-model.ser.gz -testFile converted_to_tsv.tsv
Вот небольшой скрипт для преобразования файла в TSV в python:
import json
import re
file = filepath
for line in open(file, mode="r",encoding = 'utf8'):
regex = '[ ]'
with open('output.tsv','w+') as output_file:
for line in list(filter(bool, file.splitlines())):
for word in re.split(split_regex,line):
print(word+"\tO")
output_file.write(word+"\tO"+"\n")