Удаление двух записей столбца повторяющихся перестановок в электронных таблицах - PullRequest
0 голосов
/ 07 ноября 2018

В моем проекте у меня есть электронная таблица с двумя столбцами строковых значений, например:

1 |   A  |  B   |
2 |Blagh | Nagh |
3 |Ipsum | Lorem|
4 |Nagh  | Blagh|
5 |Lorem | Fluff| 

Каждая строка уникальна, если упорядочена, однако ее перестановки не уникальны (например, A2B2 = B4A4 и т. Д.).

В этом проекте позиция не имеет значения.

Используя программу для работы с электронными таблицами, как я могу удалить эти "дубликаты перестановок"?

(В настоящее время используется LibreOffice Calc, но если это невозможно в любом из таких программ, предложения относительно использования библиотеки DataFrame, такой как Pandas, приемлемы.)

1 Ответ

0 голосов
/ 08 ноября 2018

попробую еще раз.

Сортировка по ColumnA, а затем по ColumnB (если требуется сохранить порядок, сначала добавьте столбец индекса и выполните сортировку по нему в конце).

В С1 и скопировано для соответствия:

=ROW()<>IF(INDEX(B:B,MATCH(B1,A:A,0))=A1,MAX(ROW(),MATCH(B1,A:A,0)))

Фильтр на ColumnC для удаления ячеек, показывающих FALSE.

...