Библиотека Python (или C) для создания документов XLSX, которая может обрабатывать миллионы строк - PullRequest
0 голосов
/ 22 июня 2011

Я ищу библиотеку для создания файлов XLSX, которая может содержать более миллиона строк и несколько десятков столбцов.Пока что все библиотеки, которые я нашел в Python, занимают слишком много памяти, и я не нашел подходящей библиотеки для переноса в C. Я бы предпочел открытый исходный код, чтобы при необходимости я мог изменить код.* РЕДАКТИРОВАТЬ: Я нашел решение.У openpyxl есть «Оптимизированный писатель»: http://packages.python.org/openpyxl/optimized.html

Ответы [ 2 ]

1 голос
/ 22 июня 2011

вы пробовали ElementTree? если он использует слишком много памяти, используйте SAX и просто обрабатывайте строку за раз. Синтаксический анализ XML - ElementTree против SAX и DOM

0 голосов
/ 22 июня 2011

Формат XLSX состоит из нескольких файлов XML, которые были заархивированы. Если формат вывода не изменится, было бы тривиально использовать существующий файл в качестве шаблона и просто добавлять в него строки по мере необходимости. К сожалению, ZipFile.writestr не позволяет вам записать файл по частям, поэтому вам придется записать весь XML-файл во временный файл, а затем поместить его в zip с помощью ZipFile.write.

...