Переименование нескольких столбцов в пандах - PullRequest
0 голосов
/ 17 мая 2018

У меня есть один CSV-файл, в котором я хочу переименовать некоторые столбцы с одинаковыми именами. мой исходный код выглядит так

df = pd.read_csv('New.csv')

Я извлек выбранные столбцы из кадра данных с этим кодом

df.columns[1::3]

эта нарезка получает каждые третьи столбцы. Теперь я хочу переименовать эти каждые третьи столбцы с одинаковыми именами но пытается переименовать мои столбцы, как это выдает ошибку

df.columns[1::3]= ['SomeName']
raise TypeError("Index does not support mutable operations")

Можно ли как-нибудь переименовать несколько столбцов с одинаковыми именами в пандах?

Есть ли другие предложения, кроме как сделать это вручную?

Ответы [ 3 ]

0 голосов
/ 17 мая 2018

df.columns имеет тип pandas.indexes.base.Index, поэтому вы получаете ошибку TypeError.Если вы преобразуете его в список, вы можете обновить (переименовать) с помощью среза и установить для df.columns этот обновленный список.

Это работает для меня:

lst = list(df.columns)
lst[1::3] = ['someName']*len(lst[1::3])
df.columns = lst

илииметь уникальные новые имена столбцов (как указывал @jezrael, не рекомендуется использовать одно и то же имя):

lst = list(df.columns)
lst[1::3] = ['someName{}'.format(x) for x in range(len(lst[1::3]))] 
df.columns = lst
0 голосов
/ 17 мая 2018

Основополагающими pandas объектами индекса являются numpy массивы.

Вы можете воспользоваться этим фактом для нарезки и назначения с использованием numpy соглашений.

Данные из @jezrael.Необходимость явного извлечения значений обусловлена ​​ этой известной проблемой .

df = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

arr = df.columns.values
arr[1::3] = range(2)
df.columns = arr

print(df)

   A  0  C  D  1  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
2  c  4  9  5  6  a
3  d  5  4  7  9  b
4  e  5  2  1  2  b
5  f  4  3  0  4  b
0 голосов
/ 17 мая 2018

Думаю, лучше всего использовать rename с уникальными именами новых столбцов, такими как:

df = pd.DataFrame({'A':list('abcdef'),
                   'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
                   'E':[5,3,6,9,2,4],
                   'F':list('aaabbb')})

print (df)
   A  B  C  D  E  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
2  c  4  9  5  6  a
3  d  5  4  7  9  b
4  e  5  2  1  2  b
5  f  4  3  0  4  b

d = dict(zip(df.columns[1::3], range(len(df.columns[1::3]))))
print (d)
{'B': 0, 'E': 1}


df = df.rename(columns=d)
print (df)
   A  0  C  D  1  F
0  a  4  7  1  5  a
1  b  5  8  3  3  a
2  c  4  9  5  6  a
3  d  5  4  7  9  b
4  e  5  2  1  2  b
5  f  4  3  0  4  b

Или:

d = dict(zip(df.columns[1::3], 
             ['name{}'.format(x) for x in range(len(df.columns[1::3]))]))
print (d)
{'B': 'name0', 'E': 'name1'}

df = df.rename(columns=d)
print (df)
   A  name0  C  D  name1  F
0  a      4  7  1      5  a
1  b      5  8  3      3  a
2  c      4  9  5      6  a
3  d      5  4  7      9  b
4  e      5  2  1      2  b
5  f      4  3  0      4  b

Не рекомендуется переименовывать решение для тех же имен столбцов:

d = dict.fromkeys(df.columns[1::3], 'Name')
print (d)
{'B': 'Name', 'E': 'Name'}

df = df.rename(columns=d)
print (df)
   A  Name  C  D  Name  F
0  a     4  7  1     5  a
1  b     5  8  3     3  a
2  c     4  9  5     6  a
3  d     5  4  7     9  b
4  e     5  2  1     2  b
5  f     4  3  0     4  b

потому что, если требуется выбрать столбец Name, он возвращает все столбцы в DataFrame:

print (df['Name'])
   Name  Name
0     4     5
1     5     3
2     4     6
3     5     9
4     5     2
5     4     4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...