Плюсы и минусы объекта с большим фреймом данных по сравнению со списком множества объектов классов в Python - PullRequest
0 голосов
/ 03 июля 2019

Я пишу программу на Python для выполнения определенной обработки данных для пары миллионов (N) пользователей.Результатом процесса будет несколько одномерных массивов для каждого пользователя (процесс будет применяться к каждому пользователю отдельно).Мне нужно установить и получить функции для каждого пользовательского вывода данных.

У меня есть два варианта для реализации этого: 1. Создать класс с атрибутами размера N от column_size, поэтому один объект, который содержит большие массивы 2. Создатькласс для каждого пользователя и хранить экземпляры этого класса в списке, поэтому список из N объектов

Мой вопрос заключается в том, каковы плюсы и минусы каждого подхода с точки зрения скорости и потребления памяти?

1 Ответ

0 голосов
/ 03 июля 2019

Вопрос довольно широкий, поэтому я не буду выходить за рамки общности.

Если вы собираетесь обрабатывать пользователя по пользователю, то имеет смысл иметь один объект на пользователя.

Вкл.с другой стороны, если вы в основном обрабатываете всех пользователей одновременно и атрибутируете по атрибуту, то имеет смысл иметь классы для атрибутов каждого объекта, содержащего атрибут для всех пользователей.Таким образом, если памяти становится мало, вы можете сохранить все на диск и иметь только одного пользователя (соответственно атрибут) в памяти.

...