nltk.pos_tag()
возвращает список из двух кортежей. Первый элемент каждого кортежа - это слово, второй - часть речевого тега, соответствующего слову. Например:
>>> tagged = nltk.pos_tag('This is a test'.split())
>>> tagged
[('This', 'DT'), ('is', 'VBZ'), ('a', 'DT'), ('test', 'NN')]
Предполагая, что вы хотите написать каждое слово и его тег в строке:
with open(tagged_file, 'w') as f:
for pair in tagged:
print(' '.join(pair), file=f)
Это создаст файл, содержащий:
This DT
is VBZ
a DT
test NN
Вы можете изменить формат файла при необходимости.