Машинное обучение для распознавания важных слов в предложении - PullRequest
0 голосов
/ 31 марта 2020

Я хочу использовать машинное обучение для извлечения связанных с скалолазанием названий / мест из предложения. Я уже "классифицировал" кучу данных, таких как:

Bouldering in Central Park!!||Central Park
Not the best angle but check out that latch!!! Golden Bowl (V7) in Squamish||Golden Bowl||Squamish  
Does anyone have a used crash pad for sale?||

(где у меня есть предложение, за которым следует ||, затем все имена / местоположения (снова разделенные ||)

Я смотрю на использование ML. NET для этого, так как я наиболее знаком с C#, но не могу понять, с чего начать. Я думаю, что пример классификации Iris , вероятно, ближе всего к моей ситуации? Но я не уверен,

Есть ли какие-либо предложения относительно того, какую модель классификации использовать в ML. NET? Или другой язык / структуру для использования?

1 Ответ

1 голос
/ 31 марта 2020

Вы можете легко попробовать некоторые предварительно обученные алгоритмы NER, такие как Stanford или Spacy. Вероятно, они не станут достаточными для вас, поэтому на этом этапе вам нужно определить типы ваших сущностей и сделать некоторые метки для обучения вашего собственного алгоритма NER.

Вы можете начать проверять Stanford NER и Модуль Spacy NER .

Редактировать: Вы можете изменить тип классификатора, чтобы получить разные результаты.

Пример результата в Stanford Online Demo Tool:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...