Полагаю, это зависит от вашего определения "важного".
Если вы говорите о частоте, то вы можете просто создать словарь, используя слова (или основы) в качестве ключей, а затем считать значения. После этого вы можете отсортировать ключи в словаре по их количеству.
Что-то вроде (не проверено):
from collections import defaultdict
#Collect word statistics
counts = defaultdict(int)
for sent in stemmed_sentences:
for stem in sent:
counts[stem] += 1
#This block deletes all words with count <3
#They are not relevant and sorting will be way faster
pairs = [(x,y) for x,y in counts.items() if y >= 3]
#Sort (stem,count) pairs based on count
sorted_stems = sorted(pairs, key = lambda x: x[1])