вертикальная интеграция таблицы данных с более чем 1500 столбцов - PullRequest
0 голосов
/ 06 марта 2020

У меня есть таблица данных с 1700 столбцами и 100 строками данных с уникальным идентификатором. Это данные опроса, и каждый сотрудник организации отвечает на те же 9 вопросов, но они объединены в один ряд данных для каждой организации. Есть ли способ в Python / pandas для вертикальной интеграции этих данных, в отличие от удлиненного формата на оси X, в котором он уже находится? Я режу и вставляю в настоящее время.

1 Ответ

1 голос
/ 08 марта 2020

Вы можете reshape базовый numpy массив и переиндексировать с соответствующими компаниями:

# sample data, assuming index is the company
df = pd.DataFrame(np.arange(36).reshape(2,-1))

# new index
idx = df.index.repeat(df.shape[1]//9)

# new data:
new_df = pd.DataFrame(df.values.reshape(-1,9), index=idx)

Вывод:

    0   1   2   3   4   5   6   7   8
0   0   1   2   3   4   5   6   7   8
0   9  10  11  12  13  14  15  16  17
1  18  19  20  21  22  23  24  25  26
1  27  28  29  30  31  32  33  34  35
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...