Question

У меня есть папка с 616 файлами, но мой скрипт читает только первые 100. Какие настройки мне нужно изменить, чтобы заставить их читать их все? Это, вероятно, актуально, я использую ноутбук Anaconda Navigator Jupyter Notebook.

Вот мой код:

import re
import string
from collections import Counter
import os
import glob

def word_count(file_tokens):
    for word in file_tokens:
        count = Counter(file_tokens)
    return count

files_list = glob.glob("german/test/*/negative/*")
print(files_list)
for path in files_list:
    corpus, tache, classe, file_name = path.split("\\")
    file = open(path, mode="r", encoding="utf-8")
    read_file = file.read()

    ##lowercase
    file_clean = read_file.lower()


    ##tokenize
    file_tokens = file_clean.split()

    ##word count and sort
    print(word_count(file_tokens))

Manu Valdés · Answer 1 · 22 января 2020

Возможно, вы достигли максимально допустимого числа открытых файлов в вашей системе. Вы можете либо close каждый файл в конце l oop, либо использовать менеджер контекста в l oop:

with open(path, mode="r", encoding="utf-8") as file:
    ....

lsabi · Answer 2 · 22 января 2020

Вы пытались напечатать длину переменной files_list и проверить, является ли она 616 или 100?

print(len(files_list))

Python Скрипт читает только 100 первых файлов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python Скрипт читает только 100 первых файлов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы