Я искал решение этой проблемы уже несколько дней, и я много пытался, и ничто не дает мне правильный вывод, поэтому, пожалуйста, ПОМОГИТЕ
У меня есть CSV-файл с именами белков в первых 2 столбцах, а остальные столбцы (0: 7) - это коды лекарств, которые работают, так как вы можете видеть, что у меня есть дубликаты названий белков и разных лекарств в каждой строке, поэтому Я хочу объединить все лекарства в один ряд с одинаковым названием белка
мои данные
например:
строка P08912 будет такой:
выход
и еще раз проверить, есть ли дубликаты в названиях лекарств (просто чтобы убедиться)
Я попробовал следующие коды, ни один не дает мне результат, какие-либо идеи:
x=(x.groupby(['NAME','NAME_1'], sort=False, as_index=False)
.agg({0:136})
.reindex(columns=y.columns))
x1=x.groupby(['NAME','NAME_1'], sort=False, as_index=False).join().reset_index();
x1=x.groupby(['NAME','NAME_1'], sort=False, as_index=False)[0:107].apply(' '.join).reset_index();
x1= x.groupby(('NAME')['0':'7'].apply(','.join).reset_index())