Я предполагаю, что у вас нет специального набора данных для тренировок с помеченными данными, в каких словах подчеркивать. Поэтому я думаю, что самым простым способом было бы предположить, что подчеркнутые слова являются одной и той же частью речи. Я думаю, что существительные и глаголы были бы хорошим началом, исключая, например, модальные глаголы. NLTK поставляется с PoS-Taggers .
Но поскольку естественная речь во многом зависит от контекста, людям, вероятно, также сложно найти единственное решение для того, что подчеркнуть в предложении.