У меня есть несколько текстовых файлов, которые должны быть размечены, POS и NER.Я использую теги C & C и запустил их учебник, но мне интересно, есть ли способ пометить несколько файлов, а не один за другим.
В данный момент я размечаю файлы:
bin/tokkie --input working/tutorial/example.txt--quotes delete --output working/tutorial/example.tok
следующим образом, а затем тегом части речи:
bin/pos --input working/tutorial/example.tok --model models/pos --output working/tutorial/example.pos
и, наконец, распознавание именованного объекта:
bin/ner --input working/tutorial/example.pos --model models/ner --output working/tutorial/example.ner
Я не уверен, как бы ясоздайте цикл, чтобы сделать это, и сохраните имя файла таким же, как у ввода, но с расширением, представляющим тегирование, которое оно имеет.Я думал о bash-скрипте или, возможно, Perl, чтобы открыть каталог, но я не уверен, как вводить команды C & C, чтобы скрипт мог понять.
В данный момент я делаю это вручную, и этодовольно много времени, чтобы не сказать больше!