встроенная версия DataFrame.head () в пандах - PullRequest
0 голосов
/ 10 октября 2018

Есть ли в пандах версия на месте df.head(max_rows)?

Мне нужно ограничить количество строк в моем фрейме данных, когда их слишком много для обработки.

В данный момент я делаю df = df.head(10000000), но я думаю, что это неэффективная память.

1 Ответ

0 голосов
/ 10 октября 2018

Вы можете использовать pd.DataFrame.drop для операции на месте :

n = 10000000
df.drop(df.index[n:], inplace=True)

Но это может не помочь.Согласно комментарию @ unutbu :

df.drop(..., inplace=True) действительно изменяет df на месте, но из-за способа, которым операции inplace реализованы в Pandas, реального преимущества нетчтобы сделать это через более прямое переназначение имен переменных.Лично я предпочитаю функции, которые возвращают значения, а не функции, которые изменяют значения, поскольку с первым синтаксис присваивания делает совершенно ясным, что изменяется,

Это объясняется далее в ответ Джеффа .

Кроме того, обратите внимание, что этот метод не будет работать с дублирующимися индексами.

...