У меня есть два фрейма данных pd: один содержит непрерывные переменные, которые я масштабировал с помощью sklearn.preprocessing StandardScaler, а другой содержал категорические функции, которые я суммировал с помощью pd.get_dummies. Они оба имеют одинаковое количество строк (5443), но разное количество столбцов
Когда я пытаюсь объединить эти два фрейма данных, по оси = 1 (столбцы) Python выдает
ValueError: Shape of passed values is (101, 5936), indices imply (101, 5443)
Я проверил обе формы фреймов данных, я также использовал функцию np.concatenate, которая работает, но она испортила мое фиктивное кодирование для категориальных функций
scaled.shape
Out[378]: (5443, 18)
cat_feats.shape
Out[379]: (5443, 83)
test = pd.concat([scaled,cat_feats],axis=1)
Traceback (most recent call last):
File "<ipython-input-380-f192aab9181d>", line 1, in <module>
test = pd.concat([scaled,cat_feats],axis=1)
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\reshape\concat.py", line 213, in concat
return op.get_result()
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\reshape\concat.py", line 408, in get_result
copy=self.copy)
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\internals.py", line 5207, in concatenate_block_managers
return BlockManager(blocks, axes)
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\internals.py", line 3033, in __init__
self._verify_integrity()
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\internals.py", line 3244, in _verify_integrity
construction_error(tot_items, block.shape[1:], self.axes)
File "C:\Users\Marlies\Anaconda3\lib\site-packages\pandas\core\internals.py", line 4608, in construction_error
passed, implied))
ValueError: Shape of passed values is (101, 5936), indices imply (101, 5443)
Результатом должен быть кадр данных с формой (5443,101)