Question

Я хотел бы изменить имена столбцов на основе первых трех символов имени столбца, используя словарь.

Это код, который у меня есть:

new_names = {"aud":"alc_aud","whe":"clu_whe", "per":"pre_per",
                "pol":"cou_pol","spec":"coc_spec","dark":"daw_dark"}

for x,y in new_names.items():
    if df.columns.str.startswith(x):
       df.columns = df.columns.str.replace(x,y)

Я получаю следующую ошибку:

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

jezrael · Answer 1 · 02 сентября 2018

Использование:

df = pd.DataFrame({'aud1':list('abcdef'),
                   'spe2':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'F':list('aaabbb')})

print (df)
  aud1   spe2  C  F
0    a      4  7  a
1    b      5  8  a
2    c      4  9  a
3    d      5  4  b
4    e      5  2  b
5    f      4  3  b

new_names = {"aud":"alc_aud","whe":"clu_whe", "per":"pre_per",
                "pol":"cou_pol","spec":"coc_spec","dark":"daw_dark"}

Первый фильтр первых 3 значений словаря:

new_names = {k[:3] :v for k, v in new_names.items()}

print (new_names)
{'aud': 'alc_aud', 'whe': 'clu_whe', 'per': 'pre_per', 
     'pol': 'cou_pol', 'spe': 'coc_spec', 'dar': 'daw_dark'}

И затем выберите первые 3 буквы, индексируя str[:3], а затем replace на dict:

df.columns = df.columns.to_series().str[:3].replace(new_names)
print (df)
  alc_aud  coc_spec  C  F
0       a         4  7  a
1       b         5  8  a
2       c         4  9  a
3       d         5  4  b
4       e         5  2  b
5       f         4  3  b

Другое решение с get с list comprehension, если значение не совпадает, вернуть исходное значение:

df.columns = [new_names.get(x[:3], x) for x in df.columns]
print (df)
  alc_aud  coc_spec  C  F
0       a         4  7  a
1       b         5  8  a
2       c         4  9  a
3       d         5  4  b
4       e         5  2  b
5       f         4  3  b

РЕДАКТИРОВАТЬ: Soluton работает со строками любой длины:

df = pd.DataFrame({'aud1':list('abcdef'),
                   'specd2':[4,5,4,5,5,4],
                   'podfds':[7,8,9,4,2,3],
                   'aaper':list('aaabbb')})

print (df)
  aud1  specd2  podfds aaper
0    a       4       7     a
1    b       5       8     a
2    c       4       9     a
3    d       5       4     b
4    e       5       2     b
5    f       4       3     b

new_names = {"aud":"alc_aud","whe":"clu_whe", "per":"pre_per",
                "po":"cou_pol","spec":"coc_spec","dark":"daw_dark"}

Сначала extract все значения, начинающиеся с клавиш dict, а затем map, последнее заполнение несогласованных значений на fillna:

pat = '|'.join([r'^{}'.format(x) for x in new_names])
s  = df.columns.to_series()
df.columns = s.str.extract('('+ pat + ')', expand=False).map(new_names).fillna(s)
print (df)
  alc_aud  coc_spec  cou_pol aaper
0       a         4        7     a
1       b         5        8     a
2       c         4        9     a
3       d         5        4     b
4       e         5        2     b
5       f         4        3     b

Как изменить имена столбцов на основе первых трех символов имени столбца

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как изменить имена столбцов на основе первых трех символов имени столбца

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов