У меня есть две независимые выборки, которые различаются по количеству наблюдений и распределению двух переменных (предположим, что переменных больше нет). Я хочу поддержать распределения, существующие в наборе 1 для обеих переменных в наборе 2 также. Таким образом, мне нужно найти подходящий способ пересмотреть наблюдения в выборке 2, чтобы распределения двух переменных в каждой выборке были почти одинаковыми или даже совпадали. Другими словами, я хочу создать два сбалансированных набора в двух переменных на основе распределений набора 1.
Если я не совсем ошибаюсь, мой вопрос о методах пост-стратификации и повторного взвешивания в python.
Кто-нибудь ссылается на уже опубликованный код Python, делающий именно это, или идею, как сопоставить распределения нескольких переменных в двух примерах с использованием Python?