Полагаю, нет ничего страшного в объединении двух потерь, поскольку они достаточно "ортогональны" друг другу;в то время как перекрестная энтропия рассматривает каждый пиксель как независимое предсказание, оценка костей смотрит на получающуюся маску более «целостным» способом.
Более того, учитывая тот факт, что эти две потери дают существенно разные маски, каждая из которых имеет свои достоинстваи ошибки, я полагаю, что объединение этой дополнительной информации должно быть полезным.
Убедитесь, что вы оценили потери так, чтобы градиенты от двух потерь были примерно в одном и том же масштабе, чтобы вы могли одинаково извлечь выгоду из обоих.
Если вы заставите это работать, мне будет интересно услышать о ваших экспериментах и выводах;)