Если данные уже не разделены на emp_name
(а в вашем случае это не так, а для разбиения как такового потребуется как случайное перемешивание) или данные загружаются из таблицы, сгруппированной в emp_name
(так же, как до этого нет)t) для преобразования данных в желаемый формат, например, с помощью pivot
df.groupBy("emp_name").pivot("class", [True, False]).sum()
, потребуется перемешивание.