У меня есть датафрейм, где я хочу извлечь вещи после двойного пробела.Для всех строк в столбце NAME
после названий компаний перед целыми числами стоит двойной пробел.
NAME INVESTMENT PERCENT
0 APPLE COMPANY A 57 638 232 stocks OIL LTD 0.12322
1 BANANA 1 COMPANY B 12 946 201 stocks GOLD LTD 0.02768
2 ORANGE COMPANY C 8 354 229 stocks GAS LTD 0.01786
df = pd.DataFrame({
'NAME': ['APPLE COMPANY A 57 638 232 stocks', 'BANANA 1 COMPANY B 12 946 201 stocks', 'ORANGE COMPANY C 8 354 229 stocks'],
'PERCENT': [0.12322, 0.02768 , 0.01786]
})
У меня есть это ранее, но оно также включает целые числа в названии компании:
df['STOCKS']=df['NAME'].str.findall(r'\b\d+\b').apply(lambda x: ''.join(x))
Вместо этого я попытался извлечь после двойных пробелов
df['NAME'].str.split('(\s{2})')
, что дает вывод:
0 [APPLE COMPANY A, , 57 638 232 stocks]
1 [BANANA 1 COMPANY B, , 12 946 201 stocks]
2 [ORANGE COMPANY C, , 8 354 229 stocks]
Однако я хочу, чтобы целые числа, которые встречаются после двойных пробелов, были соединены /объединить и поставить в новую колонку.
NAME PERCENT STOCKS
0 APPLE COMPANY A 0.12322 57638232
1 BANANA 1 COMPANY B 0.02768 12946201
2 ORANGE COMPANY C 0.01786 12946201
Как я могу изменить свою вторую функцию, чтобы делать то, что я хочу?