У меня есть фрейм данных pandas, который я получаю, импортируя лист Excel.Столбцы в основном представляют собой даты, но могут содержать и другой тип данных, например столбец идентификатора.Теперь я хочу получить самую последнюю дату каждой строки и имя соответствующего столбца, чтобы получить список или серию кортежей вида: id + самая последняя дата.Я довольно новичок в этом и был бы благодарен за любую помощь.Вот пример кода.
import pandas as pd
import os
def main():
#df=importExcel()
#getLastActions(df)
df1 = pd.DataFrame({'id':[1,2,3,4],
'y':[true,false,true,true],
'date1':[1996-05-31,2002-01-01,1999-07-17,2019-01-01],
'date2':[2010-10-11,2000-05-01,1999-12-17,1999-02-02],
'date3':[1993-09-11,2005-11-11,1997-08-08,2019-04-15] })
getLastActions(df1)
def importExcel():
wk_dir = os.path.dirname(os.path.realpath('__file__'))
df = pd.read_excel (wk_dir+'/OPS.xlsx')
return df
def getLastActions(df):
columns = list(df)
for i in columns:
#.......
if __name__ == '__main__':
main()
Я хотел бы получить что-нибудь.как: результат = [(1,2010-10-11), (2,2005-11-11), (3,1999-12-17), (4,2019-04-15)]
Так сказать максимальное значение каждой строки, но только столбцов, которые содержат даты.Кто-нибудь знает, как это сделать?