У меня есть Pandas Dataframe с 500 строками и 502 столбцами, ниже приведен краткий обзор имен столбцов:
['cluster', 'question1', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, ....,500]
Кластер - Номер кластера Вопрос1 - Обозначает текстовые столбцы данных (0 - 500)- содержит значения косинуса сходства каждого из 500 Вопросов друг с другом.
для каждого вопроса, я хочу отфильтровать только те строки, которые имеют значение косинуса> 0,5 (скажем, х) и <1 с любым другим вопросом. </p>
Я попробовал приведенный ниже набор кодов для фильтрации данных
filter_boolean = final_df[(final_df.iloc[:,2:] > 0.5) &(final_df.iloc[:,2:] < 1)]
Ожидаемый и фактический результат соответствуют изображениям ниже Input DataFrame Actual Output