Я действительно не знал, как дать хороший описательный заголовок, но вот мой вопрос. Давайте рассмотрим DataFrame df
:
col_name
0 Category1
1 item1()
2 item2()
3 Category2
4 item3()
5 item4()
6 item5()
Мне нужно получить это:
categories items
0 Category1 item1
1 Category1 item2
2 Category2 item3
3 Category2 item4
4 Category2 item5
Но categories
может быть континентами, а items
- странами. Я знаю, что все элементы имеют ()
с выражением внутри, поэтому я могу легко предоставить логическую маску, а затем создать список categories
с:
msk = df[~df['col_name'].str.contains('[^A-Za-z\s]')]['col_name'].tolist()
Но теперь, теперь я застрял. Не могли бы вы дать мне какой-нибудь совет?