У меня есть датафрейм с ответами на экзаменационные вопросы 1000 студентов.В каждой строке представлен 1 ученик, а в столбцах даны ответы на вопросы.
Я хотел бы сравнить каждого учащегося со следующим, а затем суммировать количество вопросов, на которые они ответили одинаково, и количество ответов, на которые он ответил по-разному.Затем я хотел бы, чтобы пут сравнения сравнивал идентифицирующие пары и итоговые значения ответов, которые были одинаковыми и разными
Это то, как далеко я получил с помощью кода для суммирования правильных ответов
def match(a,b):
sum_cor=sum(np.logical_and(df.loc[a,]==df.loc[b,],df.loc[a,]==5))
print(sum_cor)
Данные
Student Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8
0 5 5 4 5 5 5 2 4
1 5 3 5 5 5 5 2 2
2 5 5 5 5 5 5 5 2
3 5 1 5 5 5 5 5 5
4 5 5 5 5 5 5 5 4
Выход
Row_1 Row_2 #_Match #not_matched
L00 L0 5 3
L01 L1 5 3
L02 L2 5 3