Экстраполировать отсутствующие данные для сгруппированных по пандам данных - PullRequest
0 голосов
/ 19 мая 2019

У меня есть набор данных с несколькими странами и годами.Каждая комбинация страна-год представляет собой строку в данных.Через столбцы есть несколько переменных.В некоторых из них за последние несколько лет отсутствуют данные по каждой стране, что дает NaN.

Для некоторых столбцов я хочу экстраполировать эти отсутствующие значения, используя существующие данные для этого столбца, для этой страны.

Я уже создал групповой объект 'ISO страны', который был полезен для целей интерполяции, например.

Здесь есть ответ об экстраполяции пропущенных значений с помощью функции, но яне может найти способ использовать тот же подход в контексте групповой работы.Ниже приведен код группы, которую я сейчас использую для интерполяции.

# Importing the libraries
import pandas as pd

# Importing the data
dataset = pd.read_excel(file.xlsx')

byISO = dataset.groupby(['country'])\

#Interpolation
dataset[['col1','col2']] = byISO[[
                'col1','col2']]\
     .apply(lambda i: i.interpolate(method='linear', limit_area='inside'))

В данный момент код не запускается, но я хотел бы сделать что-то похожее на то, что я сделал с интерполяцией -таким образом, что я получаю экстраполированный набор чисел

...