Есть ли способ разделить состав на поезд / тест без перетасовки данных? - PullRequest
0 голосов
/ 25 февраля 2020

Я использую чувствительные ко времени данные и хотел бы поддерживать порядок данных, но стратифицируя данные, так как у меня есть несколько меток. Я не нашел ни одной библиотеки, которая бы позволяла это.

Ответы [ 2 ]

0 голосов
/ 25 февраля 2020

Пожалуйста, обратитесь к документации train_test_split .

Вы можете сделать что-то вроде этого:

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.33, random_state=0, 
                                                    stratify=y)

stratify = y даст стратифицированное разделение с теми же пропорциями меток классов в качестве входного набора данных.

0 голосов
/ 25 февраля 2020

Привет, Хуанро, не могли бы вы привести пример того, что вы пытаетесь сделать, так как это может помочь лучше понять проблему. Спасибо:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...