Я провожу эксперимент по ML на python и застреваю с данными, которые перекрываются.У меня есть датафрейм с несколькими столбцами, и строки между записями в значительной степени похожи на последующие строки.
Существуют ли функции pandas, которые могут разбивать мой фрейм данных на два набора, пытаясь уменьшить перекрытия между двумя наборами, в том смысле, что общее перекрытие между двумя наборами будет как можно меньше?
К сожалению, я не могу поделиться набором данных, но если вы можете указать мне на соответствующие функции, которых мне будет достаточно для продолжения поиска и чтения.
Я хотел бы заранее поблагодарить вас за ваш ответ С уважением Алекс