Я пытаюсь объединить конкретные вопросы, чтобы сформировать новые объединенные вопросы со значениями, которые являются средними из вопросов, которые были объединены. Я хочу только среднее значение для конкретного идентификатора. В приведенном ниже примере я пытаюсь объединить вопросы 1 и 2 (abc и def), а затем создать столбец, который включает в себя среднее из двух значений для каждого участника (обозначено идентификатором).
Это пример того, как выглядит оригинальный фрейм данных:
id question qnumber value
1 abc 1 1
1 def 2 3
1 ghi 3 4
2 abc 1 2
2 def 2 4
2 ghi 3 1
Это то, что я хотел бы, чтобы датафрейм выглядел.
id question qnumber value
1 abcdef 1 2
1 ghi 3 4
2 abcdef 1 3
2 ghi 3 1
В моем фактическом наборе данных у меня 17 вопросов, и я хотел бы объединить 3 пары, что дает 14 вопросов (11 независимых и 3 из объединенных вопросов). Мне все равно, если в итоговом столбце «вопрос» имена вопросов будут объединены в том же стиле, что и выше, но я подумал, что это облегчит понимание. Столбец qnumber не очень важен, но я не был уверен, будет ли проще комбинировать определенные строки на основе числа (как в «qnumber»), а не на основе строки (как в « вопрос "), поэтому я включил его.