45% данных имеют, по крайней мере, одно пропущенное значение. Это впечатляет. Я бы сначала посмотрел, если нет шаблона. Вы говорите, что они пропали без вести. Вы тестировали на MAR? Вы проверяли на MAR для подгрупп?
Не зная ваших данных, я сначала посмотрел бы, если бы не было случаев с большим количеством пропущенных значений, и выяснил бы, есть ли теоретические или практические причины для их исключения. Практические причины - получение данных. Это может быть связано с тем, что за ними плохо наблюдали, машина, производящая данные, не вращалась все время, опрос охватывал не все страны и т. Д. Респонденты на пенсии. Таким образом, они должны быть (системные) отсутствуют. Вы не можете заменить эти данные некоторым вычисленным значением.
Может быть, вы можете вырезать срезы из ящиков с полным и искать условия производства данных.