Я обнаружил крайне странное поведение EMR при выполнении логистической регрессии через PySpark в EMR v.5.19.0 против 5.17.0, где AUC, возвращенный в 5.17, был значительно выше (например, 0,65 против 0,55).На мой взгляд, это не имеет смысла, так как я буквально просто изменяю переменную среды, которая указывает, какую версию EMR запускать.Я также попытался запустить несколько последних версий Spark локально (2.3.0, 2.3.1, 2.3.2 и даже 2.4.0), и все они возвращают более высокий показатель AUC.Есть идеи, что может происходить?Я свежая из идей!