Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe (http://ufal.mff.cuni.cz/udpipe).
Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make
в папке src
как указано в руководстве по установке (http://ufal.mff.cuni.cz/udpipe/install) и попытался запустить «самую распространенную» команду UDPipe, а именно:
udpipe --tokenize --tag --parse udpipe_model
.
Для этого ямы скачали русскоязычную модель (https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898) и использовали запятую вот так:
./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt
.
Я должен сказать, что Руководство пользователя по UDPipe не очень ориентировано на новичков(да, я новичок в этом вопросе), и я даже не знаю, возможно ли использование '* .txt' в качестве входного файла / файлов. Тем не менее, приведенная выше команда вернула это сообщение:
Загрузка модели UDPipe: Невозможно загрузить модель UDPipe 'russian-syntagrus-ud-2.3-181115.udpipe'!
Получение любого сообщения вообще дало мне понять, что команда может бытьОК, но что-то не так с пакетом, может быть, или, скорее всего, с тем, как я используй это.Любая помощь будет оценена.Если команда, которую я пытался использовать для тегирования нескольких текстов с использованием конкретной языковой модели , не подходит каким-либо образом, пожалуйста, покажите мне правильный способ работы с этим программным обеспечением.
Я использую Debian9 (растянуть).