SSIS Процент выборки с 50% -ым разделением даже не - PullRequest
1 голос
/ 24 февраля 2020

У меня есть хранимая процедура в качестве источника данных, проходящего через RESULTS SET.

Второй шаг - использование процентной выборки для разделения собранных данных 50/50. Одна половина на go вниз на один выход, а остальная часть на второй выход. Конечным результатом после некоторых других задач являются два файла, которые загружаются в два отдельных места назначения.

Pecentage sampling example

Исходный запрос получает 11 строк данных для дней, о которых идет речь, но процентная выборка делит его на 10 строк на выходе Trustpilot и на 1 строку на выходе Feefo.

Как он может не понимать концепцию 50%? Я что-то упускаю?

1 Ответ

1 голос
/ 25 февраля 2020

Согласно Microsoft на странице документации для этой задачи , указанный процент не всегда является единственным фактором при выборе строк для отправки на выход.

Кроме того до указанного процента преобразование «Процентная выборка» использует алгоритм, чтобы определить, должна ли строка быть включена в выходные данные примера. Это означает, что количество строк в выходных данных образца может не точно отражать указанный процент. Например, указание 10 процентов для набора входных данных, который имеет 25 000 строк, может не создавать выборку с 2500 строками; образец может иметь несколько больше или меньше строк.

Если вам нужно конкретное c количество строк, вы можете использовать Row Sampling Transformation. В этом случае вам нужно получить количество строк в наборе данных, а затем использовать выражение, чтобы установить свойство количества строк задачи Row Sampling Transformation, равное половине числа строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...