Время, затрачиваемое на алгоритм классификации для обучения - PullRequest
0 голосов
/ 27 января 2020

Алгоритмам классификации, таким как SVM и XGBoost, требуется огромное количество времени для обучения, и некоторое время он продолжает работать с определенным набором данных, в то время как другие алгоритмы классификации делают это менее чем за 10 секунд для того же набора данных.

Общий размер набора данных = 141 000 точек данных, набор поездов = 75% от общего набора данных, а набор тестов = 25% от общего набора данных.

Существует ли какой-либо метод, позволяющий найти время, затраченное моделью на быть обученным?

Данные содержат 41 атрибут, среди которых 3 атрибута являются номинальными и закодированы с использованием фиктивного кодирования. После кодирования всего имеется 110 атрибутов.

Примечание. Набор данных классифицирован, поэтому я не могу поделиться им здесь.

1 Ответ

0 голосов
/ 30 января 2020

Во-первых, сколько времени слишком много времени? То, как работает XGBoost, должно занять больше времени, чем другие алгоритмы. Природа XGBoost заключается в последовательном построении деревьев с учетом ошибок каждого построенного дерева.

Независимо от этого, есть много способов узнать, сколько времени потребляется. Вы можете найти некоторые в этой теме. Они хорошо работают. https://discuss.analyticsvidhya.com/t/how-to-calculate-the-model-building-and-predicting-time-of-a-classifier-in-python/6334.

...