В пандах, как превратить строки в столбцы и назначить значение строк после? - PullRequest
0 голосов
/ 17 января 2019

В Python 3 и Pandas у меня есть этот фрейм данных:

prop_selec_cleaned.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 146322 entries, 0 to 146321
Data columns (total 2 columns):
codigo_unico    146322 non-null object
words_array     146322 non-null object
dtypes: object(2)
memory usage: 3.3+ MB

prop_selec_cleaned.reset_index().head()
index   codigo_unico            words_array
0   0   MSC 36/2010 - 465465    [comunica, o, excelentíssimo, senhor, presiden...
1   1   MPV 480/2010 - 465466   [abre, crédito, extraordinário, em, favor, da,...
2   2   MSC 38/2010 - 465467    [comunica, o, excelentíssimo, senhor, presiden...
3   3   MSC 42/2010 - 465469    [submete, à, deliberação, do, congresso, nacio...
4   4   PL 6720/2010 - 465470   [concede, auxílio, especial, e, bolsa, especia...

Мне нужно создать новый фрейм данных, в котором столбцы являются строками "codigo_unico". И строки в каждом столбце будут строки "words_array"

Что-то вроде:

MSC 36/2010 - 465465                                MPV 480/2010 - 465466                               MSC 38/2010 - 465467
[comunica, o, excelentíssimo, senhor, presiden...   [abre, crédito, extraordinário, em, favor, da,...   [comunica, o, excelentíssimo, senhor, presiden...

Таким образом, это будет кадр данных с 146 322 столбцами ("codigo_unico") и только одной строкой (заполненной "words_array")

Пожалуйста, кто-нибудь знает, как я могу это сделать?

1 Ответ

0 голосов
/ 17 января 2019

Использовать конструктор DataFrame с преобразованием столбца в 1d массив numpy по values:

df = pd.DataFrame([prop_selec_cleaned['words_array'].values],
                   columns=prop_selec_cleaned['codigo_unico'])

df = pd.DataFrame(prop_selec_cleaned['words_array'].values[None,:],
                   columns=prop_selec_cleaned['codigo_unico'])

Или создать индекс по set_index, преобразовать Series в 1 столбец DataFrame по to_frame и в последний раз транспонировать:

df = prop_selec_cleaned.set_index('codigo_unico')['words_array'].to_frame().T
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...