Выбор столбцов с помощью iloc, с отдельными индексами и диапазонами - PullRequest
0 голосов
/ 22 февраля 2019

Интересно, почему эта строка возвращает «недопустимый синтаксис» и какой правильный синтаксис используется для выбора как изолированных столбцов, так и диапазонов за один раз:

X = f1.iloc[:, [2,5,[10:19]]].values

Кстати, то же самое происходит с:

X = f1.iloc[:, [2,5,10:19]].values

Спасибо.

1 Ответ

0 голосов
/ 22 февраля 2019

Второй - правильный синтаксис, нужно только numpy.r_ для индексов конканеката:

np.random.seed(2019)

f1 = pd.DataFrame(np.random.randint(10, size=(5, 25))).add_prefix('a')
print(f1)
   a0  a1  a2  a3  a4  a5  ...  a19  a20  a21  a22  a23  a24
0   8   2   5   8   6   8  ...    0    1    6    0    2    6
1   6   3   1   3   5   0  ...    4    8    1    0    6    1
2   8   2   3   0   9   2  ...    7    1    0    7    4    4
3   7   0   8   9   0   7  ...    3    0    8    6    0    2
4   7   3   2   4   9   9  ...    0    8    8    1    4    9

X = f1.iloc[:, np.r_[2,5,10:19]].values
print(X)
[[5 8 5 3 0 2 5 7 8 5 4]
 [1 0 2 9 8 3 7 7 7 0 3]
 [3 2 6 2 1 1 1 1 8 6 2]
 [8 7 7 8 0 5 7 4 1 1 4]
 [2 9 7 2 9 3 8 5 2 5 5]]

Также возможно сначала преобразовать значения в массив numpy, тогда iloc не требуется:

X = f1.values[:, np.r_[2,5,10:19]]
print(X)
[[5 8 5 3 0 2 5 7 8 5 4]
 [1 0 2 9 8 3 7 7 7 0 3]
 [3 2 6 2 1 1 1 1 8 6 2]
 [8 7 7 8 0 5 7 4 1 1 4]
 [2 9 7 2 9 3 8 5 2 5 5]]
...