У меня есть большая электронная таблица данных в CSV-файле, где несколько строк (1 или более) принадлежат одному и тому же объекту.
Это соответствует определенному формату, то есть идентификатору «основного» строка обычно длиннее числа, начинающегося с 9. Я бы хотел как-то «пометить» (добавить дополнительный столбец с parent_id) и сделать так, чтобы строки непосредственно под основной строкой (до следующей родительской строки) были помечены этим идентификатором.
Есть ли способ сделать это? Работать с распознаванием родителя на основе т.е. регулярного выражения в идентификаторе, но я не уверен, как пометить тег, пока не сработает следующий родитель.
Упрощенный пример здесь. Верхний является родителем второго ряда. Тогда номер три новый родитель.
P_ID | P_TYPE | TRANSACTION_VALUE
9999999999 |type | 1234567
1114455 | type | 123456
9999999994 | type | 4532
[...]