Question

Можно ли открывать файлы паркета и выполнять итерацию построчно, используя генераторы?Это необходимо для того, чтобы избежать загрузки всего файла паркета в память.

Содержимое файла - pandas DataFrame.

Liana Y. · Answer 1 · 11 июня 2018

Вы не можете выполнять итерацию по строке, так как она не так, как она хранится.Вы можете перебирать группы строк следующим образом:

from fastparquet import ParquetFile
pf = ParquetFile('myfile.parq')
for df in pf.iter_row_groups():
    process sub-data-frame df

Как зациклить большой файл паркета с генераторами в python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как зациклить большой файл паркета с генераторами в python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы