Очень плохо знаком с кодированием и python, поэтому, пожалуйста, потерпите меня. Я искал и смотрел, но не смог найти решение для этого нигде.
У меня есть кадр данных из большой электронной таблицы Excel, где в столбце «Тип газа трассера» (в случайных строках) имеется непрерывный шаблон «1», «2», «1», «2». ... появляется. Эти строки должны быть отделены от остальной части таблицы. Пример раздела кадра данных:
df = {'col1': [1, 2, 3, 4, 5, 6, 7, 8, 9], 'col2': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
'Tracer gas type': ['1', '2', '1', '1', '0', '1', '2', '1', '2' ]}
df = pd.DataFrame(data=df)
Шаблон всегда начинается с 1, может повторяться неизвестное количество раз и заканчивается на 2. В этом примере, если правильно разделить, новый df должен содержать только первые 2 строки и последние 4 строки старого df:
В качестве отправной точки я смог разделить фрейм данных со значениями «1», но не смог разделить «1» , '2', '1', '2' ... разделы с этим методом:
self.new_df = self.df[self.df['Tracer gas type'] == '1']
Заранее спасибо за помощь!