Question

Я хотел бы преобразовать следующий DTM

pd.DataFrame({"ID": [1,2,3,4,5],
              "t1": [0,0,1,1,0],
              "t2": [1,1,0,0,0],
              "t3": [1,0,1,0,0],
              "t4": [0,0,0,0,0]})

в этот DF

pd.DataFrame({"ID": [1,2,3,4,5],
              "text": ["t2, t3", "t2", "t1, t3", "t1", ""]})
>> 1  t2, t3
   2      t2
   3  t1, t3

Моя попытка заключается в следующем сценарии

for col in df.columns: df = np.where(df[col] == 1, col, "")
df.apply(lambda x: " ".join(x), axis=1).str.split().apply(lambda x: ", ".join(x))

, но мне интересноесли есть более питонический способ сделать это

jezrael · Answer 1 · 25 июня 2018

Используйте DataFrame.dot со столбцами фильтра по filter или по позициям по iloc:

df1 = df.filter(like='t')

#df1 = df.iloc[:, 1:]
df = df[['ID']].join(df1.dot(df1.columns + ', ').str[:-2].rename('new'))
print (df)
   ID     new
0   1  t2, t3
1   2      t2
2   3  t1, t3
3   4      t1
4   5

Или set_index:

df1 = df.set_index('ID')
df = df1.dot(df1.columns + ', ').str[:-2].reset_index(name='new')
print (df)
   ID     new
0   1  t2, t3
1   2      t2
2   3  t1, t3
3   4      t1
4   5

Преобразовать DTM в текст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Преобразовать DTM в текст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов