Панды находят процент перекрытия и расщепления на тренировку - PullRequest
0 голосов
/ 01 июля 2019

Я провожу эксперимент по ML на python и застреваю с данными, которые перекрываются.У меня есть датафрейм с несколькими столбцами, и строки между записями в значительной степени похожи на последующие строки.

Существуют ли функции pandas, которые могут разбивать мой фрейм данных на два набора, пытаясь уменьшить перекрытия между двумя наборами, в том смысле, что общее перекрытие между двумя наборами будет как можно меньше?

К сожалению, я не могу поделиться набором данных, но если вы можете указать мне на соответствующие функции, которых мне будет достаточно для продолжения поиска и чтения.

Я хотел бы заранее поблагодарить вас за ваш ответ С уважением Алекс

...