равномерное распределение выборки по значениям признаков в pandas кадре данных - PullRequest
0 голосов
/ 14 марта 2020

У меня есть фрейм данных, который выглядит следующим образом:

| building_id | meter | timestamp | meter_reading | site_id | primary_use | square_feet | year_built | floor_count | air_temperature | cloud_coverage | dew_temperature | precip_depth_1_hr | sea_level_pressure | wind_direction | wind_speed |

Есть ли способ выбрать из этой таблицы такой, что будет такое же количество функций primary_use (конечное число из них ) а для каждого primary_use будет равномерное распределение фич? Например, primary_use включает в себя «Education» и «Office», и должна быть выборка с одинаковым номером для каждого количества этажей, year_built и аналогичной температуры. Конечная цель состоит в том, чтобы предсказать эффективность каждого primary_use, и если «Офисы» имеют много данных, например, с большим количеством этажей, это может повлиять на прогноз, поскольку большее количество этажей может косвенно означать более высокую энергоэффективность.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...