Мой ответ не будет зависеть от языка программирования, который вы используете.
Во-первых, у нас должен быть набор данных, в котором каждое имя столбца представляет атрибут, и, как правило, последний столбец или атрибут является решением.или результат этой строки.
Цель алгоритма - построить дерево, в котором первые узлы являются наиболее полезными вопросами (больший прирост информации).Но для того, чтобы решить, какой из них должен вычислять энтропию каждого атрибута.
Итак, первый шаг - узнать, каким будет корневой атрибут.Чтобы сделать это, он должен извлечь энтропию каждого атрибута и сделать соответствующие математические формулы, чтобы иметь возможность получить выигрыш в информации.Это для того, чтобы в этой итерации сравнить, какой из них имеет больший прирост информации и, следовательно, будет корневым.
Ниже будет показано, как каждый атрибут имеет параметры, например: Небо (Солнечно, Дождливо, Облачно)то, что он будет делать, это вычислить информационный выигрыш каждого параметра атрибута, добавляя к другим атрибутам.Чтобы сделать это более понятным, он просматривает набор данных для всех записей, которые, например, имеют: Sunny + все температуры, Sunny + все Rainy.Однако если энтропия этого параметра равна 0, вам не нужно будет задавать больше вопросов.
И на вопрос, который вы задали, ответ заключается в том, что этот атрибут соответствует наилучшей функции.Другими словами, функция с наибольшим выигрышем информации, поэтому та, которая приносит мне наибольшую пользу, спрашивая ее в первую очередь.