База данных совпадений и слияний нечетких строк - Dataframe - PullRequest
0 голосов
/ 01 марта 2019

У меня есть два кадра данных (со строками), которые я пытаюсь сравнить друг с другом.У одной есть список областей, у другой есть список областей с длинной, последней информацией.Я изо всех сил пытаюсь написать код для выполнения следующего:

1) Проверьте, совпадает ли строка в df1 (или частично совпадает) с именами областей в df2, затем она объединит и перенесет столбцы длинных лат.

2) если df1 не совпадает с df2, то в новом столбце будет NaN или ноль.

Код:

import pandas as pd
df1 = pd.read_csv('Dubai Communities1.csv')
df1.head()

    CNAME_E1
0   Abu Hail
1   Al Asbaq
2   Al Aweer First
3   Al Aweer Second
4   Al Bada 

df2 = pd.read_csv('Dubai Communities2.csv')
df2.head()

    COMM_NUM    CNAME_E2    Latitude    Longitude
0   315         UMM HURAIR  55.3237     25.2364
1   917         AL MARMOOM  55.4518     24.9756
2   624         WARSAN      55.4034     25.1424
3   123         AL MUTEENA  55.3228     25.2739
4   813         AL ROWAIYAH 55.3981     25.1053

Вывод после поиска и объединения будет выглядеть следующим образом:

    CName_E1    CName_E3    Latitude    Longitude
0   Area1       Area1       22          7.25
1   Area2       Area2       38          71.83
2   Area3       NaN         NaN         NaN
3   Area4       Area4       35          8.05
...