У меня есть куча файлов (почти 100), которые содержат данные в формате:
(количество человек) \ т (средний возраст)
Эти файлы были сгенерированы в результате случайной прогулки по населению определенной демографической группы. Каждый файл имеет 100 000 строк, что соответствует среднему возрасту населения размером от 1 до 100 000. Каждый файл соответствует определенной местности в стране третьего мира. Мы будем сравнивать эти значения со средним возрастом населенных пунктов аналогичного размера в развитой стране.
То, что я хочу сделать, это
for each i (i ranges from 1 to 100,000):
Read in the first 'i' values of average-age
perform some statistics on these values
Это означает, что для каждого прогона i (где i колеблется от 1 до 100 000), прочитайте в первых i значения среднего возраста, добавьте их к списку и запустить несколько тестов (например, Колмогоров-Смирнов или хи-квадрат)
Чтобы открыть все эти файлы параллельно, я подумал, что лучшим способом будет словарь файловых объектов. Но я застрял в попытке сделать вышеуказанные операции.
Является ли мой метод наилучшим (по сложности)?
Есть ли лучший метод?