Я пытаюсь сравнить тестовый файл с файлом модели и затем проверить его с результатом.
Вот что я пробовал до сих пор:
import pandas as pd
data = pd.read_csv("data.csv",encoding = "utf-16", header = 0,sep="\t")
data.head(20)
createmodel = data.drop(labels=['param1','param3','param5','param7','param9','param13','param15','colorsame'], axis=1)
createmodel.drop_duplicates().to_csv("model.csv",index=False,header =True,sep="\t",encoding="utf-16")
createmodel.head(10)
createmodel.drop_duplicates().to_csv("test.csv",index=False,header =True,sep="\t",encoding="utf-16")
createmodel.head(10)
verifyresult = pd.read_csv("verify.csv",encoding = "utf-16", header = 0,sep="\t")
verifyresult.head(20)
result = pd.merge(testmodel,createmodel, on = ["param2","param4","param6","param8","param10","param11","param12","param14","param16"])
result = result.drop_duplicates()
Вот файлы модель , тест и подтверждение
Я выполнил сравнение, используя оператор слияния, и получил вывод в переменной result
.
Единственное, что меня беспокоит, это то, что мне нужно найти одну минуту позже значения в result.Time
из verify.csv
и затем объединить значения с результатом в другом столбце. И сохранить его как CSV.
Окончательный результат должен быть следующим:
Если следующий - это фрейм данных в переменной result
:
2018.5.1 0:5 0-1 0-1 0-1 0-1 0--1 0 1 -43--42 78-79 Red
И verify.csv имеет:
2018.5.1 0:6 Green
, то есть значения, связанные с периодом времени в одну минуту значения result
переменной.
Тогда новый кадр должен быть:
Time param2 param4 param6 param8 param10 param11 param12 param14 param16 color Actual
2018.5.1 0:5 0-1 0-1 0-1 0-1 0--1 0 1 -43--42 78-79 Red Green
что является окончательным результатом.
Пожалуйста, предложите мне способ сделать и достичь того, чего я хочу.