Я пытаюсь разделить базу данных в SSMS Microsoft (SQL Server) с целью использования данных в приложении машинного обучения.
Я хотел бы разделить данные на таблицы обучения и тестирования по адресураскол 80/20. К сожалению, единственный способ сделать это - взять верхние 20% таблицы для набора тестов и затем установить оставшиеся данные в качестве обучающего набора (ВЫБРАТЬ ТОП 20 процентов ОТ ...).
Я не хочу этого делать, так как тогда мои тестовые и обучающие наборы полностью основаны на том, как они организованы в SQL, а не на каком-то случайном заполнении.
Моя конечная цель будетчтобы разделить поезд / тест 80/20, который я мог бы использовать в хранимых процедурах Python в SQL Server.