Как указано в заголовке, я пытаюсь получить кадр данных с повторением строки.
Фактор, который решает, что N повторов выполнятся, основан на длине уникальных значений конкретного столбца, присутствующего в исходном кадре данных.
После выполнения процесса повтора я хотел бы создать новый столбец, который применяет все те же уникальные значения определенного столбца исходного кадра данных к каждой новой создаваемой строке.
Я знаю, что это немного сбивает с толку, но я не могу попытаться лучше выразить свои сомнения. Итак, чтобы облегчить ваше понимание моего желаемого подхода, приведем краткий пример моего информационного кадра и желаемого выходного информационного кадра:
>> Original Dataframe
Samp Age Cs
1 A 51 msi
2 B 62 cin
3 C 55 msi
4 D 70 ebv
5 E 56 gs
....
Как видите, мой столбец Cs имеет 4 уникальных значения (которые могут не всегда быть одинаковыми для разных фреймов данных). Итак, моя цель - получить фрейм данных со следующей структурой:
>> Desired Dataframe
Samp Age Cs
1 A 51 msi
1 A 51 cin
1 A 51 ebv
1 A 51 gs
2 B 62 cin
2 B 62 msi
2 B 62 gs
2 B 62 ebv
3 C 55 msi
3 C 55 cin
3 C 55 ebv
3 C 55 gs
4 D 70 ebv
4 D 70 cin
4 D 70 msi
4 D 70 gs
5 E 56 gs
5 E 56 cin
5 E 56 msi
5 E 56 ebv
....
Как вы можете видеть, в моем желаемом кадре данных все строки повторялись 4 раза (что равно количеству уникальных значений столбца Cs ), за исключением столбца Cs (который применяет все свои уникальные значения в разных строках).