Как определить напряжение предложения с помощью пакетов Python NLP (spaCy или NLTK)? - PullRequest
0 голосов
/ 05 октября 2019

Можем ли мы обнаружить ударение в предложении (ударение на некоторых словах или паузы между словами в предложении) с использованием распространенных пакетов НЛП, таких как spaCy или NLTK?

enter image description here

Как мы можем отличить содержательные слова от структурных слов, используя spaCy или NLTK?

Поскольку все программы НЛП обнаруживают зависимости, должна быть возможность определить, какие слова ударяются вестественная речь.

Ответы [ 2 ]

1 голос
/ 07 октября 2019

Я не думаю, что NLTK или spacy поддерживают это напрямую. Конечно, вы можете найти содержательные слова с помощью любого инструмента, но это только часть изображения. Вы хотите найти программное обеспечение, связанное с просодией или интонацией, которое вы можете найти в качестве компонента системы преобразования текста в речь.

Вот недавно опубликованная исследовательская работа с кодом, который может быть хорошим местом дляначало: https://github.com/Helsinki-NLP/prosody/. Аннотированные данные и ссылки могут быть полезны, даже если код не совсем такой подход, который вы ищете.

1 голос
/ 05 октября 2019

Я предполагаю, что у вас нет специального набора данных для тренировок с помеченными данными, в каких словах подчеркивать. Поэтому я думаю, что самым простым способом было бы предположить, что подчеркнутые слова являются одной и той же частью речи. Я думаю, что существительные и глаголы были бы хорошим началом, исключая, например, модальные глаголы. NLTK поставляется с PoS-Taggers .

Но поскольку естественная речь во многом зависит от контекста, людям, вероятно, также сложно найти единственное решение для того, что подчеркнуть в предложении.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...