Используя pandas
, загрузите файл CSV и примените замену регулярного выражения к значениям столбца activity
.
Попробуйте этот код:
import re
import pandas as pd
df = pd.read_csv('your_file.csv')
df['activity'] = df['activity'].apply(lambda x: re.sub(r'^([a-zA-Z]+).*', r'\1', x))
df.to_csv('output.csv', index=False)
и если это связано с вашим вопросом здесь , то вам просто нужно
импортируйте заново и измените последнюю строку решения так:
import re
# ...
all_df['activity'] = all_df['activity'].apply(lambda x: re.sub(r'^([a-zA-Z]+).*', r'\1', x))
all_df.to_csv('all_data.csv', index=False)