Дублирование в Индексе Панд - PullRequest
0 голосов
/ 15 сентября 2018

В серии Pandas написано, что значения индекса должны быть уникальными и хешируемыми.Но когда предоставляются дубликаты индексов, он все равно сохраняет оба значения и не удаляет значение, соответствующее ранее тому же индексу, в отличие от того, что происходит в словаре в Python.Почему так?Это избегает коллизий и хранит оба значения, соответствующие одному и тому же индексуТочно, это мой код -

d=pd.Series(['Saurabh','Singh','Bazzad'],[1,2,1])

И вывод, который я получаю при печати d -

1    Saurabh
2      Singh
1     Bazzad

1 Ответ

0 голосов
/ 15 сентября 2018

index строка документа из pandas.Series

index : array-like or Index (1d)
    Values must be hashable and have the same length as `data`.
    Non-unique index values are allowed. Will default to
    RangeIndex (0, 1, 2, ..., n) if not provided. If both a dict and index
    sequence are used, the index will override the keys found in the
    dict.

Как уже упоминалось, допускаются неуникальные значения.

...