Python Скрипт читает только 100 первых файлов - PullRequest
0 голосов
/ 22 января 2020

У меня есть папка с 616 файлами, но мой скрипт читает только первые 100. Какие настройки мне нужно изменить, чтобы заставить их читать их все? Это, вероятно, актуально, я использую ноутбук Anaconda Navigator Jupyter Notebook.

Вот мой код:

import re
import string
from collections import Counter
import os
import glob

def word_count(file_tokens):
    for word in file_tokens:
        count = Counter(file_tokens)
    return count

files_list = glob.glob("german/test/*/negative/*")
print(files_list)
for path in files_list:
    corpus, tache, classe, file_name = path.split("\\")
    file = open(path, mode="r", encoding="utf-8")
    read_file = file.read()

    ##lowercase
    file_clean = read_file.lower()


    ##tokenize
    file_tokens = file_clean.split()

    ##word count and sort
    print(word_count(file_tokens))

Ответы [ 2 ]

1 голос
/ 22 января 2020

Возможно, вы достигли максимально допустимого числа открытых файлов в вашей системе. Вы можете либо close каждый файл в конце l oop, либо использовать менеджер контекста в l oop:

with open(path, mode="r", encoding="utf-8") as file:
    ....
0 голосов
/ 22 января 2020

Вы пытались напечатать длину переменной files_list и проверить, является ли она 616 или 100?

print(len(files_list))
...