выбрать номера строк для чтения из Excel в pandas dataframe - PullRequest
0 голосов
/ 17 декабря 2018

У меня есть общая электронная таблица, в которую ежедневно добавляются строки.Я создаю сценарий, который читает электронную таблицу в фрейм данных pd.read_excel(infile, sheet_name=0) и проверяет наличие дублирующихся строк, используя df.drop_duplicates(keep='first').Сценарий будет установленным на компьютере нескольких людей пакетом, который они смогут использовать в любое время, и разные люди захотят проверить разные строки.Есть ли способ заставить того, кто хочет использовать скрипт, выбрать диапазон строк, которые он хочет проверить?Например, если в электронной таблице 100 строк, и кто-то хочет проверить наличие дублирующихся строк в строках 40–60, возможно ли это сделать?

1 Ответ

0 голосов
/ 17 декабря 2018

Вы можете принять пользовательские данные для границ строк и затем передать их iloc:

import pandas as pd

start = int(input('Enter your starting row: '))
stop = int(input('Enter your ending row: '))

df_limited = df.iloc[start:stop].drop_duplicates(keep='first')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...