Один индекс странно отсутствует в панде - PullRequest
0 голосов
/ 25 июня 2018

Я импортирую файл Excel в панды.Он содержит смешанный текст и числовые данные;что мне нужно сделать, это перебрать столбец, содержащий текст с целью обработки этого текста.Однако, когда я это делаю, я получаю ключевую ошибку:

KeyError: 145831

Дело в том, что нет причины, по которой это значение должно отсутствовать.Значения до и после него присутствуют:

hashtags['tweet'].loc[145829:145834]

145829    Internet Marketing Made Easy. Stop By:   https...
145830               @sbxr Lol. How’s the fishing up there?
145832    @HelloMD_com @TreatWellHealth Tinctures are or...
145833    @MikeBloomberg We would like to suggest that y...
145834    @mannydr Yeah the whole re-labeling thing is w...

По какой-то причине 145831 просто не существует.Я попытался переиндексировать фрейм данных, но KeyError остается.

Может кто-нибудь предложить обходной путь, или почему это может происходить?Обратите внимание, что Excel открыл сообщение об ошибке, когда я открыл лист, сказав, что он восстановил некоторые данные - это, вероятно, имеет значение.

1 Ответ

0 голосов
/ 25 июня 2018

По моему мнению, должно быть две причины - значения индекса уже находятся в файле Excel, а некоторые строки отсутствуют или некоторые строки были удалены после чтения файла Excel.

Решение - создать индекс по умолчанию:

hashtags = hashtags.reset_index(drop=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...