У меня есть оценки из нескольких файлов, которые я объединяю, и отметки времени, которые приходят еженедельно для тестов на идентичные идентификаторы, и я должен сравнить их с основным файлом.Если что-то меняется с оценками, завершением или скоростью, то я хочу добавить исходный файл с новой строкой и значениями и отсортировать их по отметке времени.
Я могу создать master df с глобусом, но при попыткесравнить что-то наподобие того, что получается 1 строка
from datetime import datetime
list = []
allfiles = glob.glob(path)
keys = [datetime.fromtimestamp(os.path.getmtim ( f)).strftime\('%Y-%m-%d %H:%M:%S') for f in allfiles]
key = 0
# Combine all files and time stamp when they were modified based on excel file
for xls in allfiles:
combined_df = pd.read_excel(xls, sheet_name = "Roster", header = 3)
combined_df.dropna(axis=0, how="all", inplace=True)
combined_df["time_stamp"] = keys[key]
list.append(combined_df)
key += 1
temp_master_df = pd.concat(list)
copy_temp = temp_master_df.copy() #Creates copy
original = "path.xls"
original_df = pd.read_excel(original)
for unique in original_df["ID"].unique:
new_temp = copy_temp[copy_temp["ID"]==unique]
original_df = original_df[original_df['ID']==unique].sort_values(['time_stamp'], ascending=False)
# Select Rating, Speed, Completed(Y/N?)
if any(new_temp['Rating'].isin(original_df['Rating'])):
pass
else:
original_df.append(new_temp)
Я пытаюсь создать новый оригинальный файл с добавленными в него строками, отсортированный по дате последнего изменения