У меня есть список из ~ 2M строк и список из ~ 800 слов.Я создал фрейм данных со строками в виде строк и слов в виде столбцов.За исключением строковой переменной, все остальные переменные имеют значения true или false, соответствующие тому, находится ли слово в строке.Отсутствуют пропущенные значения.
т.е.
import pandas as pd
df = pd.DataFrame({'strings':['a string with california',
'a string with lobster',
'a str with california and lobster'],
'california':[True,False,True],
'lobster':[False,True,True],
'string':[True,True,False],})
Поскольку фрейм данных слишком длинный и широкий для просмотра сразу, я хотел бы иметь переменную, которая перечисляет имена столбцов, которые имеютистинное значение для этой конкретной строки.Например,
df_filtered = pd.DataFrame({'strings':['a string with california',
'a string with lobster',
'a str with california and lobster'],
'matches':[['string','california'],
['string', 'lobster'],
['california', 'lobster']],
'california':[True,False,True],
'lobster':[False,True,True],
'string':[True,True,False],})
Я новичок в пандах и выяснил, что могу создать список имен столбцов с пропущенными значениями с помощью следующей команды
columns_w_na = df.columns[df.isnull().any()].tolist()
Есть ли способчто я могу, для каждой строки, аналогичным образом захватывать имена столбцов с определенным значением и представлять его в виде списка?