Попробуйте следующим образом:
DataFrame:
d={'COLUMN':
['AA=123' ,
'AA=123, BB=4',
'AA=123, BB=4, CC=5, DD=6 ',
'AA=123, BB=4, CC=5, DD=6, EE=78, FF=99']}
df=pd.DataFrame(d)
Функция для поиска шаблона:
def f(s):
m=['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z']
p = []
r=''
for x in s:
if x in m and x not in p:
p.append(x)
r+=str(x)
return r
Создать category
столбец:
df['Category']=df['COLUMN'].apply(lambda x : f(x))
Вывод:
COLUMN Cateory
0 AA=123 A
1 AA=123, BB=4 AB
2 AA=123, BB=4, CC=5, DD=6 ABCD
3 AA=123, BB=4, CC=5, DD=6, EE=78, FF=99 ABCDEF