Ошибка Python: слишком много индексов для массива - PullRequest
1 голос
/ 06 июля 2019

У меня есть столбец данных, который я хотел бы преобразовать в числовой, например:

for col in df.columns[22:33]:
   df[col] = pd.to_numeric(df[col], errors = 'coerce')

Который прекрасно работает. Однако всякий раз, когда я пытаюсь включить более одного диапазона, например:

for col in df.columns[22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89,91:94 ]:
    df[col] = pd.to_numeric(df[col], errors = 'coerce')

Я получаю ошибку,

IndexError:  too many indices for array

Есть ли способ обойти это, я бы не хотел делать это снова и снова для каждого диапазона. Благодаря.

Ответы [ 3 ]

2 голосов
/ 06 июля 2019

это функциональность np.r_.Вы передаете массив чисел и срезов, он создаст / объединит их в расширенный массив.

cols = np.r_[22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89,91:94]

array([22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38,
       39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55,
       56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 68, 69, 71, 72, 74, 75, 76,
       77, 78, 81, 82, 83, 84, 85, 88, 89, 91, 92, 93])

После этого вы можете использовать cols как

df.columns[cols]
1 голос
/ 06 июля 2019

Предполагая, что целевые столбцы представляют целые имена для столбцов в кадре данных (в соответствии с вашим примером), вы можете изменить строку и объединить результат.

target_cols_str = "22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89, 91:94"
df_series = []
for col in target_cols_str.split(','):
    col = col.strip()  # Remove any whitespace.
    if ':' in col:
        lhs, rhs = col.split(':')
        df_series.append(df.loc[:, int(lhs):int(rhs)])
    else:
        df_series.append(df.loc[:, int(col)])
df2 = pd.concat(df_series, axis=1)

Применяется к вашему примеру для преобразования исходного кадра данных в числовые значения:

target_cols_str = "22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89, 91:94"
for col in target_cols_str.split(','):
    col = col.strip()  # Remove any whitespace.
    if ':' in col:
    lhs, rhs = col.split(':')
    for col_name in range(int(lhs), int(rhs) + 1):
        df.loc[:, col_name] = pd.to_numeric(df.loc[:, col_name], errors = 'coerce')
    else:
        df.loc[:, int(col)] = pd.to_numeric(df.loc[:, int(col)], errors = 'coerce')
1 голос
/ 06 июля 2019

Затем вы должны создать 2 цикла.Создайте список с элементами, состоящими из диапазонов, затем зациклите его. Внутри этого цикла вставьте исходный код цикла.

Как:

for i in range_list:
    for col in df.columns[i]:
        #do your code here. 

Ваш range_list будет иметь диапазонытебе нужно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...