Точность, Recall и F1 баллы зависят от класса. Поскольку у вас есть бинарный классификатор, представьте себе запутанную матрицу следующим образом

Тогда ваша точность будет истинно положительной / истинно положительной + ложно положительной, а ваш отзыв - истинно положительной / истинно положительной + ложной отрицательной. Вы можете прочитать больше об этом в Википедии
Исходя из ваших значений, модель 1 работает лучше, чем модель 2, за исключением того, что модель 2 исправила некоторые ложные отрицательные значения за счет истинного положительного.