У меня есть пандас с двумя столбцами, заполненными наборами панд. Я хочу проверить, что все значения в одном столбце являются подмножеством другого столбца. Я думал, что приведенный ниже код будет работать, но, похоже, вы не можете применить .issubset () к двум сериям с наборами.
Ex:
data = [[['one','orange','green'],['one','orange']],[['milk','honey'],['Clarke', 'honey']]]
df = pd.DataFrame(data, columns=['Column_1','Column_2'])
Are_all_column_2_values_valid = df.loc[:, 'Column_2'].apply(set).issubset(df.loc[:, 'Column_1'])
desired_output = pd.series([True,False])
Все значения в обоих наборах будут строками.
Любая помощь будет принята с благодарностью!