Одним из наиболее часто используемых предположений при формулировании статистической проблемы обучения является то, что выборки являются IID, это означает, что ваши выборки распределены одинаково, поэтому вся выборка должна быть получена из одного и того же распределения. Когда вы говорите, что у вас есть две разные dataet, это означает, что это предположение неверно, и большинство теоретических гарантий больше не выполняются. Теперь, возможно, ваш вопрос в том, что означает «распределение данных», это просто совместный закон p (x, y), где x - это функции, а y - метки. Таким образом, два набора данных имеют разные распределения, это означает, что p_ {1} (x, y)! = P_ {2} (x, y)