Я работаю над проблемой классификации текста, для которой я использую 30-кратную перекрестную проверку.Перед началом эксперимента я убедился, что в каждом классе было не менее 30 учеников.Затем я выполнил необходимую обработку текста и разделил свой набор данных на наборы тестов и обучающих наборов.
x_train, x_test, y_train, y_test = cross_validation.train_test_split(data['event_name_description'], data['category_id'], test_size=0.2, random_state=42)
Набор тестов состоит из 20% всех данных.Теперь, когда я запускаю свою модель для обучения, я получаю это предупреждение:
/home/hp/anaconda3/envs/tensorflow/lib/python3.5/site-packages/sklearn/cross_validation.py:553: Warning: The least populated class in y has only 23 members, which is too few. The minimum number of labels for any class cannot be less than n_folds=30.
Видимо, кажется, после разделения моих данных на набор тестов и набор обучений , у меня есть по крайней мере один классв моем поезде , в котором всего 23 члена.Я прав?