Что это за НЛП? - PullRequest
       30

Что это за НЛП?

0 голосов
/ 05 июля 2019

Я знаю, что классификация НЛП - это когда мы классифицируем весь текст как (Здоровье, Спорт, Социальная сфера, Бизнес и т. Д.)

(ЛОНДОН) - Рафаэль Надаль выступил с резкой критикой всей Англии Уникальные правила высева клуба в субботу, за два дня до начала Уимблдон.

«Я уважаю правила Уимблдона, - сказал Надаль журналистам, - если я Верь, честно это или нет, это другая история. Я действительно лично верю [это] не так. "

Уимблдон использует специальную формулу для разработки семян для турнир, который иногда отклоняется от стандартного рейтинга ATP. формула придает дополнительный вес записи ATP игрока на травяных кортах, поднимать или штрафовать игроков, которые играют реже или имеют меньше успех на траве.

В этом году рейтинг Уимблдона понизил Надаль до третье семя турнира с Роджером Федерером, прыгающим выше его. Тот потребуется Надаль, чтобы победить обоих игроков, посеянных над ним, чтобы выиграть заглавие. Это также настраивает возможность встречи с Ником Кирджиосом. во втором раунде.

Киргиос победил Надаля на этом турнире раньше.

«Система такая, какая есть», - сказал Федерер в своей прессе. конференция. «В конце дня, если вы хотите выиграть турнир, Вы должны пройти через всех игроков, которые находятся перед вами. "

Авторские права © 2019, ABC Radio. Все права защищены.

Это будет считаться текстом "Спорт"

Но это не то, что я хочу

Я хочу идентифицировать слова или несколько слов в тексте

как в тексте выше, если я хочу идентифицировать игроков

(ЛОНДОН) - Рафаэль Надаль выступил с резкой критикой всей Англии Уникальные правила высева клуба в субботу, за два дня до начала Уимблдон.

«Я уважаю правила Уимблдона», Надаль сказал журналистам: «... если я Верь, честно это или нет, это другая история. Я действительно лично верю [это] не так. "

Уимблдон использует специальную формулу для разработки семян для турнир, который иногда отклоняется от стандартного рейтинга ATP. формула придает дополнительный вес записи ATP игрока на травяных кортах, поднимать или штрафовать игроков, которые играют реже или имеют меньше успех на траве.

В этом году рейтинг Уимблдона повысился Надаль до Третье семя турнира с Роджером Федерером прыгающим над ним. Тот потребуется Надаль , чтобы победить обоих игроков, посеянных над ним, чтобы выиграть заглавие. Также настраивается возможность матча с Nik Kyrgios во втором раунде.

Киргиос победил Надаль на этом турнире ранее.

«Система такая, какая она есть», - сказал Федерер в своей собственной прессе. конференция. «В конце дня, если вы хотите выиграть турнир, Вы должны пройти через всех игроков, которые находятся перед вами. "

Copyright © 2019, ABC Radio. Все права защищены.

Как называется этот метод и есть ли для него библиотеки Python?

Ответы [ 3 ]

1 голос
/ 05 июля 2019

Подпадает под категорию распознавания именованных объектов (NER).Вы можете использовать NLTK и Spacy для этого.Такие инструменты, как RASA NLU, также позволяют обучить модель распознавать эти объекты.

Вот некоторые ссылки, которые могут быть полезны:
https://towardsdatascience.com/named-entity-recognition-with-nltk-and-spacy-8c4a7d88e7da
https://rasa.com/docs/rasa/nlu/entity-extractio

1 голос
/ 05 июля 2019

Это проблема извлечения именованных сущностей.Вы можете использовать библиотеки NLP ядра NLTK, Spacy, Stanford core для распознавания именованных объектов.

1 голос
/ 05 июля 2019

Вы хотите идентифицировать имена, персоны в этом тексте? Это называется NER - Named Entitiy Recognotion.

Вы можете использовать знаменитую библиотеку nltk, если хотите проанализировать ее: https://www.nltk.org/book/ch07.html,

Распознавание именованных сущностей NLTK в списке Python

https://www.nltk.org/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...