Я пытаюсь обработать «большой» набор данных.Это лист Excel с 5k строк и 30 столбцов.Большинство данных, хранящихся в ячейках, являются строками.Что я должен сделать, это выполнить простые задачи с этими данными, такие как:
Количество повторений строки
Проверка некоторых правил, которые должны следовать данным в той же строке (тольконесколько, если нужно, чтобы проверить это)
И так далее ...
Моя первая попытка состояла в том, чтобы создать 5k объектов (1 на строку), зарядить данные в них и затем запуститьтесты.Но сохранение данных в этих объектах заняло около часа только для 1k строк.Я сделал это в python с модулем openpyexcel в режиме только для чтения.
У меня вопрос ... есть ли более быстрый способ сделать это?
ОТВЕТ НА МОЙ ВОПРОС ЗДЕСЬ ссылка