У меня большой набор данных 5,000
наблюдений, и подмножество моих данных выглядит следующим образом:
AandB
1 222 454 213.51 59.15%
444 630 789.46 6.15%
2 374 798 807.69 32.00%
304 738 263.59 19.95%
177 641 617.86 18.07%
857 937 842.27 51.97%
973 127.33 0.03%
86 205 146.62 1.18%
Мне нужны две переменные, A
и B
из этой одной переменной.
Например, 1 222 454 213.51
должно быть в столбце A
как 1222454213.51
, а соответствующее наблюдение в переменной B
должно быть 59.15%
Существует двойной пробел, разделяющий, какие значения я хочу в A
и что я хочу в B
в необработанных данных.
Следовательно, мне нужно:
A B
1222454213.51 59.15%
444630789.46 6.15%
2374798807.69 32.00%
304738263.59 19.95%
177641617.86 18.07%
857937842.27 51.97%
973127.33 0.03%
86205146.62 1.18%
Мне удалось получить переменную A
со следующими данными:
generate A = reverse(substr(reverse(AandB),strpos(reverse(AandB), " "), . ))
replace A = subinstr(A, " ", "", .)
Однако у меня возникают проблемы с извлечением процентных чисел.