Я хочу преобразовать папку текстовых документов в следующий формат:
texts = ['text of document 1', 'text of document 2', 'text of document 3',...]
для применения методов интеллектуального анализа текста.
Пока мой код следующий:
import os
file= "*.txt"
path = "C:\\"
texts=[]
for files in os.listdir(path):
with open(path + files) as f:
for x in f:
texts.append(x)
К сожалению, результат отличается от желаемого:
texts = ['line 1 of document 1', 'line 2 of document 1', …]
Что я делаю неправильно? Кто-нибудь может предложить улучшение для моего кода?