Чем индекс данных Pandas отличается от других столбцов? - PullRequest
0 голосов
/ 27 сентября 2019

Я пытаюсь использовать Pandas для использования dataframe.interpolate для заполнения пробелов во временном ряду, но возникают проблемы при настройке индекса, который требуется этой функции.

Это поднимает более общиевопрос: Фрейм данных Pandas состоит из ряда столбцов , каждый из которых состоит из элементов по одному dtype.Есть также индекс строки , который для меня очень похож на столбец.

Итак ... в чем разница между индексом фрейма данных (строки) и всеми другими столбцами?Например, я мог бы подумать, что существует требование, чтобы все записи индекса были уникальными, как ключ базы данных SQL, но, похоже, это не так?Итак, опять же, что особенного в индексе строк по сравнению с неиндексированными столбцами?

1 Ответ

0 голосов
/ 27 сентября 2019

Индекс позволяет команде loc вызывать указанные строки.Если есть дублирование, вы можете назвать все дубликаты.Если вы хотите указать одну строку, используйте либо иерархическую индексацию, либо iloc (числовая позиция).

Дублирование значений в индексе очень важно, поскольку оно облегчает иерархическую индексацию.Это очень полезно в пандах

Так что индекс - это строка, которую вы назначили в качестве индекса.Также очень полезно удалить столбец (назначив его индексу), манипулировать кадром данных и снова ввести индекс обратно в виде столбца.

Интерполировать - это очень крутая команда, но из памяти она работает только для столбцов.Если вы хотите интерполировать индекс,

df.reset_index(inplace=True)

Затем интерполируйте этот новый столбец, а затем

 df.set_index('column interpolated', inplace=True)

Для временных рядов рассмотрите функцию roll.Вы можете использовать его для перемещения по отсутствующим данным.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...