Как вы делаете нечеткую группировку в python? - PullRequest
0 голосов
/ 29 января 2020

В настоящее время я работаю в Python с фреймом данных из 5 столбцов. Моя конечная цель состоит в том, чтобы мой сценарий создал таблицу Excel, в которой перечислены определенные строки моих данных, основанные на следующем: я хочу знать, когда столбцы 1,2,3 и 4 равны друг другу И данные в столбце 5 аналогичный. Я уже конкатенировал свои первые 4 столбца и сейчас ищу способ сопоставить конкатенированный столбец с аналогичными значениями, которые встречаются в столбце 5.

Я пытался использовать для этого нечеткий, но я борюсь с тем, как именно структурировать мой код. Есть ли способ использовать fuzzywuzzy для группировки похожих данных в одном столбце, а затем сопоставить эти данные с другим столбцом?

...