Создать модель POSTagger - PullRequest
0 голосов
/ 02 марта 2019

Я пытаюсь создать модель, которая принимает предложение ввода в автономном приложении Android и возвращает мне части речи для этого предложения.Теперь языком ввода будет индийский язык, поэтому я пытаюсь подготовить свою модель для работы.У меня уже есть помеченные данные для обучения языку, который я буду использовать.

Я также сталкивался с моделями Opennlp, которые выполняют ту же работу для английского языка.Теперь возможно создать модель и использовать ее с библиотекой Opennlp, своего рода модель Opennlp.Я не уверен, возможно ли это на самом деле.

В качестве альтернативы я подумал о том, чтобы обучить свою модель некоторому алгоритму машинного обучения, а затем использовать его, но я не представляю, как я буду использовать эту модель, как и я.У меня нет предопределенной библиотеки со всеми доступными командами, как у меня с Opennlp.

Подводя итог, мне нужно создать собственную модель для интеграции в приложение Android, которое будет определять части речивход.Приложение должно работать в автономном режиме, однако обучающую часть и другие элементы предварительной обработки можно выполнить в режиме онлайн.

Ответы [ 2 ]

0 голосов
/ 04 марта 2019

Найти POS-предложения для предложения на индийском языке с нуля - большая задача. Сначала вам нужно создать огромный корпус с правильно помеченными тегами pos и обучить модель (которая уже доступна для английского языка).

Таким образом, возможный подход будет использовать API перевода языка для перевода предложения на английский язык и выполнения вашего дальнейшего задания / анализа.

0 голосов
/ 02 марта 2019

Обучать модели с OpenNLP своими собственными данными довольно просто, либо с помощью инструментов командной строки, либо через API.Для тегов части речи см .: https://opennlp.apache.org/docs/1.5.3/manual/opennlp.html#tools.postagger.training

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...