TomekLinks fit_sample (X, y) занимает много времени - PullRequest
1 голос
/ 08 мая 2019

Я работаю над проблемой классификации текста.Я использую класс TomekLinks модуля imblearn для повторной выборки моих данных. Но после вызова метода fit_sample (X, y) программы класса TomekLinks ничего не происходит, даже если я жду 30 минут.Мой набор данных состоит из 1800000 записей (текстовые данные). Вот фрагмент кода

из imblearn.under_sampling import TomekLinks

tl = TomekLinks (return_indices = True, ratio = 'Большинство', random_state= 42) X_tl, y_tl = tl.sample (train_x, y_binary)

Может ли кто-нибудь помочь, почему так долго?

Также, когда я делаю tl.fit () отдельноэто завершается в течение нескольких секунд, но когда я вызываю метод tl.sample (), возникает ошибка, что в TomekLinks

отсутствует атрибут с именем sample
...