Последовательное имя столбца в кадре данных python - PullRequest
0 голосов
/ 21 февраля 2020

Я работаю в python. У меня есть большой DataFrame df1 (25000 x 484), где, кроме первых 4 столбцов, все остальные можно разделить на группы по 4 и иметь порядковый номер. Для ясности, если не учитывать первые 4 столбца, заголовок столбцов выглядит так:

comp_type_1 / tag_1 / length_1 / value_1 / comp_type_2 / tag_2 / length_2 / value_2 / comp_type_3 / tag_3 / length_3 / value_3 ....

Я хотел бы создать df2 таким, чтобы он содержал только столбец lenght_i , где я перехожу от 1 к последнему числу (120. Есть ли способ понять, что, учитывая, что часть имени столбца одинакова, и что меняет только число?

Спасибо!

Ответы [ 2 ]

1 голос
/ 21 февраля 2020

Если я правильно понимаю вопрос, это то, что вы ищете.

# setup
df = pd.DataFrame(np.random.randint(0,100,size=(3, 12)), columns=["comp_type_1", "tag_1", "length_1", "value_1", "comp_type_2", "tag_2", "length_2", "value_2", "comp_type_3", "tag_3", "length_3", "value_3"])

# column filter 
df2 = df[[_ for _ in df.columns if 'length' in _]]

Вывод (df2)

    length_1    length_2    length_3
0   91          81          23
1   42          92          50
2   61          79          76
0 голосов
/ 21 февраля 2020

Данный фрейм данных df Вы можете фильтровать по столбцам:

df = df.filter(regex=("length"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...