Как реконструировать маргинальный набор данных в обычный pandas фрейм данных? - PullRequest
0 голосов
/ 02 августа 2020

У меня есть таблица на полях, которая выглядит так. (3 строки x 87 столбцов)

    workclass  Government
    education  Bachelors+
    occupation Bin 3
    hours-per-
    week       <45
    capital-   
    gain       Capital Gain  Capital Loss  No Capital Gain ...
    
    income     
    -------------------------------------------------------
    <=50k       28             29            479
    >50k        72             32            265
    All         100            61            744

Однако я хочу преобразовать его в обычный фрейм данных, подобный этому.

       workclass  education    occupation  ... income
   ----------------------------------------------------
   0   Government Bachelors+   Bin 3       ...  <=50k
   1   Private    Bachelors+   Bin 1       ...  <=50k
   2   Private    No Bachelors Bin 3       ...  <=50k
   

Я, честно говоря, не знаю, с чего начать. Просто нужны предложения. Я попытался выполнить pd.melt (df), но столбец «доход» исчез (я предполагаю, что это связано с тем, что индекс в маргинальной таблице был «доходом»), а вместо этого столбец «значение» выглядит следующим образом .

  workclass  education    occupation  ... value
  -----------------------------------------------
  Government Bachelors+   Bin 3       ...  26
  Private    Bachelors+   Bin 1       ...  70
  Private    No Bachelors Bin 3       ...  98

Мой результат должен быть фреймом данных, который я смогу использовать для прогнозирования дохода с помощью классификатора регрессии logisti c.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...