pandas: индексирование тысяч строк в фрейме данных - PullRequest
0 голосов
/ 20 сентября 2018

У меня изначально было 100 тыс. Строк в моем наборе данных.Я прочитал CSV с помощью панд в dataframe под названием данных.Я попытался сделать выборку из 51 строки, используя .loc.Мои метки индекса имеют числовые значения 0, 1, 2, 3 и т. Д. Я пытался использовать эту команду - data = data.loc['0':'50'] Но результаты были странными, он занял все строки от 0 до 49999, похоже, что он принимает строки до значения индексаначинается с 50.

Аналогичным образом я попытался с помощью этой команды - new_data = data.loc['0':'19'], и в результате были получены все строки, начиная с 0 до 18999.

Может ли это быть ошибкой в ​​пандах?

1 Ответ

0 голосов
/ 20 сентября 2018

Вы хотите использовать .iloc вместо .loc, поскольку вы выбираете данные из кадра данных с помощью числовых индексов.

Например:

data.iloc[:50,:]

Имейте в видучто ваши индексы имеют числовой, а не строковый тип, поэтому запрос со строкой (как вы сделали в своем OP) пытается сопоставить строковые сравнения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...