Как добавить столбцы с «заполненными данными» после заполнения пропущенных значений в пандах или на питоне, используя различные или несколько методов, таких как различные статистические методы или методы машинного обучения.
Что я хочучтобы сделать это, после заполнения данных, скажем, со средним, средним значением или значениями стандартного отклонения или с другими алгоритмами машинного обучения, такими как KNN или XGBoost или какой-либо другой метод, то я хочу добавить или добавить те или иные конкретные столбцыв конце файла CSV или Excel, но не ниже фактических данных, я имею в виду к правой стороне файла.
Например, я заполнил недостающие данные определенного столбца, используя статистическиеметоды и другие методы ML, затем я хочу добавить эти «заполненные значения» вместе с исходными значениями в новом столбце, имеющем фактическое имя с подчеркиванием и технику, с которой данные заполняются для этой конкретной функции, и добавить их в концеданные на правой стороне данных.Например, столбец или функция - это «телефон», затем на правой стороне после заполнения пропущенных значений должны отображаться все исходные или фактические значения плюс значения, рассчитанные с помощью статистических средств или средств ML с именем столбца, таким как «phone_Mean» или «phone_interpolation»."или" phone_KNN "или" phone_XGBoost "и тому подобное.
Что я уже сделал?Я применил способы со страницы документации pandas и stackoverflow, которые, как правило, имеют высокий уровень зачисления и находятся в топ-7/10 ссылок в поисковых системах google или duckduckgo, но все пошли напрасно.
Я действительно сталкиваюсь с этой проблемой в последние несколько дней, из-за которой я искалечен, чтобы убедить моего клиента.Так что будет очень полезно, если вы поможете мне с примером кода, использующим pandas или основной код python для поддержки вашего ответа.
Вот фрагмент набора данных.Допустим, я применяю методы для функции / столбца с именем «телефон»: