У меня огромный массив данных с несколькими типами столбцов - string, boolean, integer, float (это важно, потому что это означает, что я не могу использовать np.repeat
для этой проблемы. Вот почему я спрашиваю свой собственный, потому что Я считаю, что подобные решения здесь не работают для меня. Или это, или я не знаю, как!). Ну, один из моих столбцов - это идентификационный номер, и по некоторым причинам в некоторых строках есть несколько номеров, перечисленных в разделе ID. Как то так:
i ID Name Boolean1 Boolean2 etc
0 2755 Blahblah1 True False ...
1 2894, 4755 PainInMy2 True True ...
2 331 Blehblue False False ...
Я хочу разделить эту болезненную строку таким образом, чтобы каждый идентификационный номер находился в отдельной строке, а все остальные значения дублировались под ним. т.е.
i ID Name Boolean1 Boolean2 etc
0 2755 Blahblah1 True False ...
1 2894 PainInMy2 True True ...
2 4755 PainInMy2 True True ...
3 331 Blehblue False False ...
Каким элегантным образом я могу этого достичь? Имейте в виду, что это огромный Pandas DF с сотнями тысяч строк и дюжиной столбцов разных типов; и я хотел бы сохранить большинство, если не все, метаданных pandas df. Я могу разделить его на серии for
с и if
с, но я чувствую, что должен быть более простой, возможно, всего несколько строк, способ сделать это. Может быть с split(',')
или чем-то подобным. Но я не могу понять, как. Спасибо!
(Пожалуйста, не отмечайте это как дубликат. Я не смог найти ответ, который работал бы для меня!)