определить начало pandas кадра данных, пропуская значения nan - PullRequest
0 голосов
/ 13 февраля 2020

Я читаю Excel, для которого я хочу начать несколько строк после значений nan:

NaN
NaN
NaN
NaN
Code

Я делаю так:

for data in range(len(df)):
   try:
      if 'Code' in df.iloc[data,0]:
      df = df.iloc[data:,:]
   except:
      passs

но таким образом я пропустить другие ошибки синтаксического анализа

Я пытаюсь это:

if pd.isna(df.iloc[data,0]):
    pass
if 'Code' in str(df.iloc[data,0]):
    df = df.iloc[data:,:]

Но я получаю:

argument of type 'float' is not iterable in the 'Code' line

Любая помощь в решении этой более эффективной

Ответы [ 2 ]

1 голос
/ 13 февраля 2020

У меня нет большого опыта использования pandas, но когда я посмотрел документацию для read_excel, я получил ниже, что может помочь вам пропустить NaN значения.

вы можете передать ниже параметров, пока чтение Excel

  1. na_values ​​
  2. keep_default_na
  3. na_filter

вы можете получить больше информации здесь

0 голосов
/ 13 февраля 2020

Skiprows будет полезен для пропуска некоторых строк и чтения данных при чтении из Excel.

df_can = pd.read_excel('https://....Canada.xlsx',
                   sheet_name='Canada by Citizenship',
                   skiprows=range(20),
                   skipfooter=2)

Пожалуйста, проверьте эту суть для того, чтобы прочитать файл Excel в pandas dataframe после пропуска некоторых строк .

https://gist.github.com/dhamayanthim80/b0d861d7cffe48094f89fd8e05609e17

Извините, если мой ответ не имеет отношения к вашему вопросу.

чтение Excel в фрейм данных python начиная со строки 5 и включая заголовки

Пожалуйста, проверьте, полезно ли это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...