Я очень новичок в использовании Python и гуглюсь, но, похоже, ничто не вписывается в мою проблему.
У меня есть набор данных, подобный следующему:
groupID sentenceID strings
A 0 'abc'
A 0 'def'
A 1 'ghi'
B 0 'abc'
B 1 'def'
B 2 'ghi'
, и я хотел бы, чтобы результат выглядел следующим образом:
groupID sentenceID strings
A 0 'abc. def'
A 1 'ghi'
B 0 'abc'
B 1 'def'
B 2 'ghi'
Записано простым английским языком, чтоЯ пытаюсь сделать это следующим образом:
Для уникальной группы в groupID:если предложение повторяется, то объединить строкиесли предложение не дублируется, выведите строку
Я уверен, что это легко сделать с пандами, но у меня проблемы с пониманием этого. Может ли кто-нибудь помочь? Заранее спасибо.