У меня есть Dataframe, в котором некоторые столбцы содержат неверную информацию. Эта неверная информация всегда перед более длинной последовательностью значений NaN. Давайте представим, что у меня есть следующий набор данных:
import pandas as pd
from numpy import nan
d = {'Obs1': [1, 2, 3, 4, 5, 6, 7, 8], 'Obs2': [0.1, 0.1, nan, nan, nan, nan, 100, 101]}
df = pd.DataFrame(data=d)
«Obs1» не содержит неверной информации, в то время как «Obs2» имеет неправильные значения перед последовательностью 4-NaN. Кто-нибудь знает, как найти такую более длинную последовательность во временных рядах (например, появление 4 значений NaN), чтобы затем заполнить все предыдущие записи NaN? Чтобы привести пример, мой желаемый результат будет:
Output = {'Obs1': [1, 2, 3, 4, 5, 6, 7, 8], 'Obs2': [nan, nan, nan, nan, nan, nan, 100, 101]}
Заранее спасибо