Как использовать конкретную языковую модель для UDPipe - PullRequest
0 голосов
/ 04 февраля 2019

Я хочу пометить несколько текстовых файлов с помощью программного обеспечения UDPipe (http://ufal.mff.cuni.cz/udpipe).

Я скачал двоичные пакеты UDPipe, удалось установить все зависимости, я запустил make в папке srcкак указано в руководстве по установке (http://ufal.mff.cuni.cz/udpipe/install) и попытался запустить «самую распространенную» команду UDPipe, а именно:

udpipe --tokenize --tag --parse udpipe_model.

Для этого ямы скачали русскоязычную модель (https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2898) и использовали запятую вот так:

./udpipe --tokenize --tag --parse russian-syntagrus-ud-2.3-181115.udpipe test_input/*.txt.

Я должен сказать, что Руководство пользователя по UDPipe не очень ориентировано на новичков(да, я новичок в этом вопросе), и я даже не знаю, возможно ли использование '* .txt' в качестве входного файла / файлов. Тем не менее, приведенная выше команда вернула это сообщение:

Загрузка модели UDPipe: Невозможно загрузить модель UDPipe 'russian-syntagrus-ud-2.3-181115.udpipe'!

Получение любого сообщения вообще дало мне понять, что команда может бытьОК, но что-то не так с пакетом, может быть, или, скорее всего, с тем, как я используй это.Любая помощь будет оценена.Если команда, которую я пытался использовать для тегирования нескольких текстов с использованием конкретной языковой модели , не подходит каким-либо образом, пожалуйста, покажите мне правильный способ работы с этим программным обеспечением.

Я использую Debian9 (растянуть).

...