Question

У меня есть два CSV-файла для нечеткого совпадения. Столбцы в файле-1 - это (ID, имя_партии), а столбцы в файле-2 - это (идентификатор_партии, имя_приты)При выполнении нечеткого сопоставления с использованием библиотеки fuzzywuzzy, она возвращает три значения (prty_name, match_score и row_number). Я также хочу вернуть party_id файла-2, когда каждый столбец файла-1 сопоставляется с файлом-2.

пример данных в файле-1

ID, party_name
1,'james mackson'
2,'thomas editon'

примерданные в файле-2

party_id,prty_name
234, 'james mackson'
123, 'george p'
453, 'James anidon'

Я попытался вернуть дополнительные столбцы из кода, но это не помогло.

column_val_6 - это кадр данных, содержащий все значения party_name из файла-1, которыйбудет обработан для каждой строки.

column_val_6 = csv_source_1.party_name column_val_2 = csv_source_2.prty_name

for i in column_val_6:
 for found, score, row_num in process.extract(i, column_val_2, limit=1):
            if score >= 50:
                print('%d%% partial match: "%s" with "%s" ' % (score, i, found))

I need the output as
party_name, prty_name, match_percentage, party_id
'James Mackson', 'James Mackson', 100, 234
'thomas editon', 'James Anidon', 40, 453

Возврат дополнительного столбца при выполнении нечеткого сопоставления с использованием нечеткого питона

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Возврат дополнительного столбца при выполнении нечеткого сопоставления с использованием нечеткого питона

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы