Панды добавляют исходный файл, если значения столбцов не совпадают - PullRequest
0 голосов
/ 17 мая 2019

У меня есть оценки из нескольких файлов, которые я объединяю, и отметки времени, которые приходят еженедельно для тестов на идентичные идентификаторы, и я должен сравнить их с основным файлом.Если что-то меняется с оценками, завершением или скоростью, то я хочу добавить исходный файл с новой строкой и значениями и отсортировать их по отметке времени.

Я могу создать master df с глобусом, но при попыткесравнить что-то наподобие того, что получается 1 строка

from datetime import datetime

list = []
allfiles = glob.glob(path)
keys = [datetime.fromtimestamp(os.path.getmtim (    f)).strftime\('%Y-%m-%d      %H:%M:%S') for f in allfiles]
key = 0

# Combine all files and time stamp when they were modified based on excel file

for xls in allfiles:
combined_df = pd.read_excel(xls, sheet_name = "Roster", header = 3)
combined_df.dropna(axis=0, how="all", inplace=True)
combined_df["time_stamp"] = keys[key]
list.append(combined_df)
key += 1

temp_master_df = pd.concat(list)
copy_temp = temp_master_df.copy() #Creates copy

original = "path.xls"
original_df = pd.read_excel(original)

for unique in  original_df["ID"].unique:
    new_temp = copy_temp[copy_temp["ID"]==unique]

original_df = original_df[original_df['ID']==unique].sort_values(['time_stamp'], ascending=False)

# Select Rating, Speed, Completed(Y/N?)
if any(new_temp['Rating'].isin(original_df['Rating'])):
    pass
else: 
    original_df.append(new_temp)

Я пытаюсь создать новый оригинальный файл с добавленными в него строками, отсортированный по дате последнего изменения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...