База 2 для логарифма почти наверняка, потому что нам нравится измерять энтропию в битах.Это просто соглашение, некоторые люди используют вместо этого базу e (nat вместо битов).
Я не могу говорить о Xgboost, но для дискретных задач решения энтропия входит в игру как мера производительности, а не напрямую как результатдревовидной структуры.Вы можете рассчитать информационный прирост любого разделения (используя любой коэффициент ветвления) только из определения энтропии.
Если вы ищете книгу по теории информации и вероятности, я настоятельно рекомендую MacKay (доступен полный PDF).Он охватывает довольно много машинного обучения и статистики.Деревья решений, однако, не покрыты.