Question

Это пример файла, который у меня есть,

Name     Att1     Att2     Att3
AB_EN    1        2        3
CD       5        6        7
FG_EN    7        8        9

Итак, в столбце «Имя», где присутствует «_EN», я хочу удалить часть «_EN». Вывод должен быть следующим:

Name     Att1     Att2     Att3
AB       1        2        3
CD       5        6        7
FG       7        8        9

Это то, что я пытался:

name = df['Name']

for entry in name:
    if "_EN" in entry:
       entry = entry.split('_')[0]

Однако это не работает. Какой хороший способ сделать это?

Rakesh · Answer 1 · 10 октября 2019

Использование str.split

Пример:

df = pd.DataFrame({"Name": ["AB_EN", "CD", "FG_EN"]})
df['Name'] = df['Name'].str.split("_").str[0]
print(df)

Выход:

  Name
0   AB
1   CD
2   FG

Harsh Patel · Answer 2 · 10 октября 2019

Это должно работать для вас:

df['Name'] = [name.split('_')[0] for name in df['Name']]

Вам просто нужно внести изменения в ряд в вашем фрейме данных.

Ivo Merchiers · Answer 3 · 10 октября 2019

В вашем случае это будет

df['Name']=(df.Name
      .str.split('_')  # split on _
      .str[0] # Only keep first part of the split
    )

Как разбить строку в столбце внутри фрейма данных pandas?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.