Постановка задачи: В pyspark мне нужно сравнить два столбца по диагонали для ex снизу входного фрейма данных. Мне нужно сравнить stn_fr_cd и stn_to_cd, т. Е. Для val_no 1 иметь 2 строки. Теперь я должен сравнить stn_fr_cd первого ряда с stn_to_cd второго ряда и stn_to_cd первого ряда с stn_fr_cd второго ряда.
Снизу входного фрейма данных, так как для val_no оба диагностических элемента stn_fr_Cd и stn_to_cd равны, я увеличил свое значение как 1
Ниже мой вход имеет 4 столбца id, val_no, stn_fr_cd, stn_to_cd
id val_no stn_fr_cd stn_to_cd
8A 1 CPH GDN
8A 1 GDN CPH
8A 2 GDN CPH
8A 2 CPH GDN
8A 3 CPH GDN
8A 3 GDN CPH
8A 4 CPH GDN
8A 4 GDN CPH
Ниже должен быть мой вывод
8A 4
Как получить 4 для val_no 1,2,3,4 и диагональные элементы stn_fr_cd и stn_to_cd равны
Может кто-нибудь, пожалуйста, помогите мне с logi c в pyspark pls. Мне действительно нужно преодолеть это препятствие, пожалуйста, помогите с кодом