Таблица выглядит следующим образом:
Вопрос : из всех случаев, классифицированных с ошибка в диапазоне 0-10% для предмет Физика , вернуть таблицу значений, где процент ученика больше или равен 95% от процента ученика в BSchool1 (тест) для диапазона ошибок 0-10% и предметной физики.
[IN]
import pandas as pd
data = [['B1', 'Grade_physics', '0-10%', 70],['B1', 'Grade_physics', '10-20%', 5],['B1', 'Grade_physics', '20-30%', 25],['B1', 'Grade_Maths', '10-20%', 20],['B1', 'Grade_Maths', '0-10%', 60],['B1', 'Grade_Maths', '20-30%',20 ],['B2', 'Grade_Maths', '0-10%', 50],['B2', 'Grade_Maths', '10-20%', 15],['B2', 'Grade_Maths', '20-30%', 35],['B2', 'Grade_physics', '10-20%', 30],['B2', 'Grade_physics', '0-10%', 60],['B2', 'Grade_physics', '20-30%',10 ]]
df = pd.DataFrame(data, columns = ['BSchool Name', 'Graded in','Error Bucket','Stu_perc'])
df
[OUT]
BSchool Name Graded in Error Bucket Stu_perc
0 B1 Grade_physics 0-10% 70
1 B1 Grade_physics 10-20% 5
2 B1 Grade_physics 20-30% 25
3 B1 Grade_Maths 10-20% 20
4 B1 Grade_Maths 0-10% 60
5 B1 Grade_Maths 20-30% 20
6 B2 Grade_Maths 0-10% 50
7 B2 Grade_Maths 10-20% 15
8 B2 Grade_Maths 20-30% 35
9 B2 Grade_physics 10-20% 30
10 B2 Grade_physics 0-10% 60
11 B2 Grade_physics 20-30% 10
[IN]:
#Subset of values where error bucket and subject are sliced
filter1 = df['Graded in'].str.contains('Grade_physics')
filter2=df['Error Bucket'].str.contains('0-10%')
df2 = df[filter1 & filter2]
#Compare the value of student percentage in sliced data to benchmark value
#(in this case student percentage in BSchool1)
filter3 = df2['BSchool Name'].str.contains('B1')
benchmark_value = df2[filter3]['Stu_perc']
df['Qualifyinglist']=(df2[['Stu_perc']]>=0.95*benchmark_value)
[OUT]:
ValueError: Wrong number of items passed 2, placement implies 1
[IN]:
df['Qualifyinglist']=(df2['Stu_perc']>=0.95*benchmark_value)
[OUT]:
ValueError: Can only compare identically-labeled Series objects
Что я пытаюсь сделать:
У нас есть связи с B-школами, и мы пытаемся предсказать общую оценку учеников в каждой B-School. Затем мы пытаемся классифицировать случаи, когда прогноз был неточным, основываясь на сегментах 0–10%, 10–20% и т. Д. Например, для физики для бизнес-школы 1 70% случаев были идентифицированы правильно с ошибкой в диапазоне от 0 доПрогнозирование в 10%, 5% случаях имело ошибку в диапазоне 10-20% для физики в BSchool 1 и так далее. Наша модель в B-School 1 была успешной. Поэтому мы хотим увидеть, на какие B-школы мы можем нацеливаться сейчас.
Однако я получаю ошибку, как показано выше.
Значение Ошибка: неверное количество пройденных предметов 2, размещениеподразумевает 1 это не помогло мне. Пожалуйста, помогите