Не могу извлечь текст правильно в список - PullRequest
1 голос
/ 23 апреля 2019

У меня есть список файлов, которые я хотел бы извлечь из каждого текста и поместить текст для каждого файла в отдельный список.Хотя вывод выводится в виде строк, из-за чего мне трудно определить, какой текст принадлежит какому файлу.

----------- это список файлов:

[WindowsPath('C:/Users/xxxx/Desktop/test_folder/final test.txt'),  WindowsPath('C:/Users/xxxx/Desktop/test_folder/iptest.txt'), WindowsPath('C:/Users/xxxx/Desktop/test_folder/New Text Document.txt'), WindowsPath('C:/Users/xxxx/Desktop/test_folder/test2.txt')]

----------- Вывод, который я получаю:

rgerg



egfreg



secret

dafreagr 343.23.12.53.100 aefref
secret

grre

regreg



ergre

тест работает

---------- Мне бы хотелось, чтобы вывод был:

[['rgerg','egfreg','secret'],
['dafreagr 343.23.12.53.100 aefref'],
['secret','grre','regreg','ergre'],
['test is working']]

------------ ИЛИ, возможны отдельные списки:

['rgerg','egfreg','secret']
['dafreagr 343.23.12.53.100 aefref']
['secret','grre','regreg','ergre']
['test is working']

------------- У меня есть функция "loader ()", которая в настоящее время извлекает текст файла:

 for items in txt_files:
   for item in loader(items):
    words = item
    print(words)

Мне не удалось получить желаемый результат с помощью списка и словаря.Не уверен, как мне поступить по этому поводу.

ОБНОВЛЕННЫЙ ВЫХОД:

Вывод:

C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\XXXX\Desktop\test\New Microsoft Word Document.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx
C:\Users\xxxx\Desktop\test\secretwe.docx

Вывод:

S
e
c
r
e
t












S
e
c
r
e
t

t
h
i
s

i
s

a

t
e
s
t

d
o
c
u
m
e
n
t

f
o
r

k
e
y
w
o
r
d

s
c
a
n
s
.




T
h
i
s

i
s

a

t
e
s
t
.




S
e
c
r
e
t
s
e
c
r
e
t

1 Ответ

1 голос
/ 23 апреля 2019

Вам необходимо объявить список result и затем добавить к нему данные.

Пример:

result = []
for items in txt_files:
    temp = []
    for item in loader(items):
        temp.append(item)
    result.append(temp)

print(result)

Редактировать согласно комментарию

result = []
for items in txt_files:
    result.append(loader(items).splitlines())
print(result)
...