Мои навыки программирования очень (х10) ограничены.Но у меня есть этот маленький скрипт на Python:
#load data
files = '/Users/xxx/Desktop/Test_SP/a.txt'
file = open(files, 'rt')
text = file.read()
file.close()
# split into words
from nltk.tokenize import word_tokenize
tokens = word_tokenize(text)
# stemming of words
from nltk.stem.porter import PorterStemmer
porter = PorterStemmer()
stemmed = [porter.stem(word) for word in tokens]
print(stemmed[:20])
Может кто-нибудь сказать, пожалуйста, как запустить этот скрипт для ВСЕ файлы в этом каталоге (/Users/xxx/Desktop/Test_SP
), а не только для 1Файл за один раз (a.txt
)
(я уже знаю о glob, os.walk
и т. Д., Но мне не удалось заставить его работать. Каждая помощь очень ценится.)