Question

Я пытаюсь объединить строки, которые не начинаются с определенного символа c ('['), с ближайшей строкой, которая начинается с него. Я прочитал текстовый файл следующим образом:

start df ,

и ожидаю получить

end df .

Quang Hoang · Answer 1 · 06 мая 2020

Вы можете использовать str[0] для проверки первого символа, затем cumsum для пометки блоков:

df['text'].groupby(df['text'].str[0].eq('[').cumsum()).agg(' '.join)

Вывод:

text
1            [aaa] sss
2    [bbb] mmm fff ppp
3        [iii] rrr qqq
4            [ggg] kkk
Name: text, dtype: object

Объединить строки в pandas на основе условия

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Объединить строки в pandas на основе условия

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы