Я только начал с моделирования нейронных сетей, и что-то беспокоит меня. Поскольку мои данные не сбалансированы (90/10), и я не хочу отдавать приоритет одному классу, в настоящее время я использую M CC (коэффициент корреляции Мэтьюса) для оптимизации. Сначала я использовал стратифицированную 10-кратную перекрестную проверку. Модель, однако, работает очень плохо (M CC близко к 0). После исключения стратификации производительность резко возросла до значения, которое я ожидаю от других моделей. Я не могу понять, почему это так, и кажется, что расслоение вместе с такими показателями, как f1, каппа или m cc, кажется распространенным явлением.