Как я могу отделить существительное, например Internet of Things, от текста с помощью python3? - PullRequest
0 голосов
/ 30 мая 2018

Например, у меня есть это предложение:

x=IoTTech offers the latest Internet of Things news and strategy.

Я хочу разбить это предложение.Мой код:

x.split(' ')

Результат:

['IoTTech', 'offers', 'the', 'latest', 'Internet', 'of', 'Things', 'news', 'and', 'strategy.']

Но я хочу получить такой результат:

['IoTTech', 'offers', 'the', 'latest', 'Internet of Things', 'news', 'and', 'strategy.']

Как мне поступить?TNX

1 Ответ

0 голосов
/ 30 мая 2018

Тема, которую вы ищете, - это распознавание именованных объектов (NER) или, по крайней мере, часть тегов речи (POS), которые являются целыми подполями обработки естественного языка (NLP).Существует несколько наборов инструментов Python, в частности spacy и nltk , которые пытаются объединить инструменты, которые вам часто нужны при обработке созданного человеком текста, включая инструменты для выполнения NER и POS-тегов,но я бы посоветовал вам изучить область НЛП, чтобы увидеть, есть ли другие инструменты или конкретные алгоритмы, которые вы особенно хотите использовать для своего конкретного приложения.

...