Я понимаю, что уже есть еще один пост , но он немного устарел и на самом деле не отвечает на вопрос.
Я понимаю, что мы можем использовать параметр DATA_SPLIT_METHOD для разделения набора данных для обучение и оценка. Но как мне убедиться, что они оба представляют собой разные наборы данных?
Так, например, я установил для DATA_SPLIT_METHOD значение AUTO_SPLIT, и мой набор данных находится в диапазоне от 500 до 500 тыс. Строк, поэтому 20% данных будут используется в качестве оценки. Как мне убедиться, что оставшиеся 80% будут использованы для обучения, когда я проведу свою оценку (ML.EVALUATE?